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内 容 简介 


任何 网 站 的 发 展 都 不 是 一 跳 而 就 的 。 它 在 发 展 过 程 中 会 遇 到 各 种 
各 样 的 问题 和 业务 带 来 的 压力 。 正 是 这 些 问题 和 压力 推动 着 技术 的 进 
步 和 发 展 ， 而 技术 的 发 展 反 过 来 又 会 促进 业务 的 更 大 提升 。 如 今 淘宝 
网 的 流量 排名 已 是 全 球 前 15 名 、 国 内 前 3 名 ， 其 系统 服务 器 也 从 一 台 发 
展 到 万 台 以 上 。 

本 书 从 工程 师 的 角度 讲述 淘宝 这 个 超大 规模 互联 网 系统 的 成 长 历 
程 ， 及 其 所 有 主动 和 被 动 的 技术 变革 的 前 因 后 果 。 书 中 有 幕后 故事 、 
产品 经 验 、 架 构 演 进 、 技 术 启 蒙 ， 也 有 大 牛 成 长 、 业 内 八卦 、 失 败 案 
例 、 励 志 故 事 。 全 书 文 风流 畅 ， 有 技术 人 员 特 有 的 幽默 感 ; 内 容积 极 
正面 ， 有 现场 感 ， 全 部 是 作者 杀身 经 历 。 


未 经 许可 ， 不 得 以 任何 方式 复制 或 抄袭 本 书 之 部 分 或 全 部 内 容 。 
版 权 所 有 ， 侵 权 必 究 。 
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序 


这 是 一 本 好 玩 的 书 ， 从 前 面 两 章 看 ， 主 要 是 讲 故事 ;从 后 面 两 章 
看 ， 主 要 是 讲 人 物 ， 从 中 间 几 章 看 ， 主 要 是 讲 拷 术 。 我 在 写作 的 过 程 
中 ， 把 部 分 章节 的 内 容 放 到 了 我 的 博客 上 ， 有 人 看 了 说 很 励志 ， 有 人 
看 了 说 对 技术 有 帮助 ， 有 人 看 了 说 对 产品 有 帮助 ， 有 人 看 了 说 对 创业 
有 帮助 ， 有 人 看 了 说 其 中 的 内 容 特 别 逗 ， 现 在 我 也 不 知道 这 是 人 文 读 
物 还 是 技术 书 了 。 

其 实 技术 书 很 容易 写成 催眠 的 读物 ， 对 于 这 本 书 ， 我 一 开始 就 没 
有 当 作 技术 书 来 写 ， 最 早 是 我 写 给 自己 看 的 。 在 2011 年 年 底 的 时 候 ， 
我 突然 意识 到 在 淘宝 度 过 了 七 年 的 时 光 ， 七 年 说 长 不 长 ， 说 短 不 短 ， 
回忆 起 来 有 些 往 事 历 历 在 目 ， 有 些 却 已 开始 模糊 。 为 了 给 自己 留 点 回 
忆 ， 我 就 开始 记录 自己 这 几 年 的 故事 ， 七 年 之 间 发 生 了 很 多 有 趣 的 事 
情 ， 越 写 越 多 ， 写 着 写 着 ， 我 就 希望 能 够 挖掘 更 多 的 内 容 了 。 当 时 我 
还 担任 着 “淘宝 技术 大 学 ”的 校长 ， 这 给 我 的 写作 提供 了 得 天 独 厚 的 优 
势 ， 我 可 以 听 不 同 的 人 讲 淘宝 技术 所 有 的 事情 。 于 是 我 就 开始 凭 记忆 
去 写 淘 宝 在 过 去 几 年 的 技术 进展 ， 再 去 找 当事人 求证 内 容 的 细节 。 然 
后 又 由 于 有 些 当 事 人 实在 太 有 料 了 ， 我 干脆 把 跟 他 交谈 的 内 容 也 整理 
出 来 ， 当 作 《 牛 P 列 传 》 来 呈现 给 读者 (淘宝 的 技术 人 员 以 P 级 来 定 
义 ， 牛 P 就 是 很 高 级 别 的 专家 ) 。 至 此 ， 本 书包 含 了 三 种 行文 格式 的 
内 容 : 一 个 是 笔者 自己 经 历 的 美好 时 光 ， 一 个 是 淘宝 技术 的 发 展 历 
程 ， 一 个 是 那些 牛人 的 牛 事 。 和 希望 能 够 通过 这 三 个 维度 ， 让 读者 对 淘 
宝 的 技术 有 一 个 概括 的 了 解 ， 进 而 通过 淘宝 对 互联 网 的 技术 有 一 个 概 

书 名 取 为 《淘宝 技术 这 十 年 》， 口气 有 点 大 了 ， 但 我 很 难 用 一 个 
更 确切 的 名 字 来 概括 本 书 的 内 容 ， 淘 宝 在 这 十 年 里 的 技术 是 很 难 用 一 
本 书 来 写 完 的 ， 对 于 笔者 不 太 熟 悉 的 领域 (例如 运 维 、 云 计算 、 大 数 
据 ) ， 没 敢 着 墨 太 多 ， 书 中 主要 围绕 网 站 的 业务 和 系统 架构 之 间 的 关 
系 展 开 论 述 。 我 希望 能 够 抛砖引玉 ， 未 来 有 更 多 的 人 来 写 《 淘 宝 运 维 
这 十 年 》《 淘 宝 数据 这 十 年 》.……. 


写 完 本 书 之 后 ， 再 回 过 头 来 读 ， 我 意识 到 自己 经 历 了 一 场 伟大 的 
变革 ， 这 个 时 代 把 电子 商务 推 到 了 一 个 浪潮 之 题 ， 我 是 这 个 浪潮 中 的 
一 滴水 珠 ， 我 无 意 描 述 这 场 伟 大 的 浪潮 ， 只 和 希望 通过 一 滴水 珠 映 射出 
浪潮 底下 的 故事 。 这 不 是 淘宝 官方 的 史书 ， 我 不 具备 这 样 的 高 度 和 视 
野 ， 这 只 是 一 个 小 人 物 的 所 见 所 想 。 

这 本 书写 得 很 轻松 ， 我 大 概 花 了 3 个 月 时 间 就 写 完 了 ， 这 主要 得 益 
于 其 中 的 事情 都 是 笔者 亲身 经 历 的 。 同 时 ， 这 种 写作 状态 也 直接 导致 
了 本 书 的 行文 风格 天 马 行 空 ， 一 边 讲 业务 ， 一 边 讲 技术 ， 时 不 时 地 还 
做 一 些 不 太 高 明 的 点 评 。 从 2011 年 年 底 开 始 写 ， 到 2012 年 年 初 ， 书 中 
的 主要 内 容 都 有 了 ， 接 下 来 就 是 求证 各 种 细节 的 过 程 ， 这 比 初稿 要 艰 
难 很 多 ， 我 访谈 了 书 中 提 到 的 几乎 所 有 人 ， 有 时 候 还 要 请 他 们 帮忙 补 
充 一 些 内 容 ， 由 于 人 员 众 多 ， 这 里 不 一 一 列 出 ， 在 此 一 并 表示 感谢 
一 一 亲 ， 这 是 我 们 共同 的 作品 。 

这 里 特别 要 提出 感谢 的 是 我 的 师父 岳 旭 强 ， 他 比 我 更 早 加 入 淘 
宝 ， 行 文 的 时 间 线 是 根据 他 给 我 讲 的 故事 来 写 的 。 他 现在 是 蘑菇 街 的 
CTO， 属 于 自己 创业 。 他 离开 淘宝 也 是 触动 我 写本 书 的 原因 之 一 ， 铁 
打 的 营盘 ， 流 水 的 兵 ， 虽 然 淘宝 的 人 员 流失 率 总 体 较 低 ， 但 是 每 离开 
一 个 人 就 失去 了 一 段 故事 ， 如 果 我 现在 不 写 ， 未 来 也 许 很 难 呈 现 出 过 
往 的 这 一 切 了 。 老 天 选择 了 我 做 技术 ， 选 择 了 我 能 写 点 文字 ， 选 择 了 
我 经 历 淘宝 的 发 展 ， 选 择 了 我 做 淘宝 技术 大 学 的 校长 ， 似 乎 也 选择 了 
我 要 把 这 些 故 事 交 代 给 读者 。 

其 次 要 感谢 对 本 书 贡献 最 大 的 一 个 人 ， 书 里 的 故事 是 我 在 “淘宝 技 
术 大 学 ”给 学 员 上 课时 讲 的 ， 但 每 个 故事 的 第 一 个 听众 都 不 是 技术 人 
员 ， 也 不 是 淘宝 员工 ， 是 我 家 里 的 CEO ， 她 经 常 被 我 当 作 学 生 ， 听 我 
讲 一 个 多 小 时 的 课 ， 然 后 给 我 指出 各 种 不 足 。 同 时 ， 为 了 让 我 安心 写 
作 ， 她 也 赦免 了 我 很 多 家 务 活 ， 谢 谢 亲 。 

最 后 要 感谢 本 书 的 编辑 张 春 十 先生， 他 花费 了 很 大 精力 帮 有 我 修改 
书稿 ， 在 他 的 帮助 下 ， 本 书 从 网 文 变 得 像 一 本 书 了 。 另 外 ， 虽 然 本 书 
经 历 了 笔者 和 编辑 的 多 次 修改 ， 但 这 如 同 开发 软件 一 样 ， 上 线 之 后 发 
现 bug 的 概率 还 是 很 大 的 ， 如 有 错漏 之 处 ， 冤 请 读者 不 音 赐教 。 

子 柳 @ 杭 州 

2013 年 4 月 1 日 


第 2 章 个 人 网 站 的 升级 
数据 库 从 mySQL 到 Oracle 
\ 入 的 上 | 亲 ES 


高 性 能 服务 框架 HSF 
消息 中 间 件 Notify 
分 布 式 数据 访问 层 TDDL 
Session 框 架 
开放 平 ES 
第 6 章 我 在 淘宝 这 八 年 


第 0 章 引言 : 光棍 节 的 狂欢 


淘宝 网 不 就 是 一 个 网 站 吗 ? 是 的 ， 但 淘宝 网 不 是 一 个 简单 的 网 
站 ， 它 的 规模 排 在 全 球 前 十 几 名 ， 顶 尖 的 网 站 需要 顶尖 的 技术 作为 支 
撑 。 在 用 户 享受 淘宝 的 乐趣 的 背后 ， 有 哪些 神秘 的 技术 在 支撑 它 呢 ? 

“时 间 到 ， 开 抢 ! * 坐 在 电脑 前 早已 等 待 多 时 的 小 美 一 看 时 间 已 到 
2011 年 11 月 11 日 零 时 ， 便 迫不及待 地 投身 于 淘宝 商城 一 年 一 度 的 大 型 
网 购 促销 活动 一 一 “淘宝 双 11 购 物 狂 欢 节 ”。 小 美 打开 早已 收藏 好 的 宝 
贝 一 一 某 品牌 的 雪 地 靳 ， 飞 快 的 点 击 购买 、 付 款 ， 一 回头 发 现 3000 双 
靳 子 已 被 抢购 一 空 。 

小 美 跳 起 来 ， 大 叫 一 声 “ 欧 耶 ! ” 

小 美 不 知 道 ， 就 在 11 日 零点 过 后 的 这 一 分 钟 里 ， 全 国有 342 万 人 和 
她 一 起 涌 入 淘宝 商城 。 当 然 ， 她 更 不 知道 ， 此 时 此 刻 ， 在 淘宝 杭州 的 
一 间 办 公 室 里 ， 灯 火 通明 ， 这 里 是 * 战 时 指挥 部 ”， 淘 宝 技 术 部 的 一 群 
工程 师 正 紧 盯 着 网 站 的 流量 和 交易 数据 。 白 板 上 是 他 们 刚刚 下 的 赌 
注 ， 赌 谁 能 最 准确 地 猿 中 流量 峰值 和 全 天 的 交易 总 额 。 他 们 的 手边 放 
着 充足 的 食物 和 各 类 提神 的 饮料 。 

一 阵 急 促 的 电话 铃声 响起 ， 是 前 线 部 门 询问 数据 的 ， 工 程 师 大 声 
报 着 : “第 1 分 钟 ， 进 入 淘宝 商城 的 会 员 有 342 万 人 ”。 过 了 一 会 儿 ， 工 
旦 师 主 动 拿 起 电话 :“ 交 易 额 超过 1 亿 元 人 民 币 了 ， 现 在 是 第 8 分 钟 。” 
接 下 来 , “第 21 分 钟 ， 刚 突破 2 亿 元 ”, “第 32 分 钟 ，3 亿 元 了 ”, “第 1 个 
小 时 ，4.39 亿 元 ”。 这 些 数据 随后 出 现在 微 博 上 ，5 引 起 了 一 片 惊 呼 。 

“完蛋 了 ! ”突然 有 人 大 喝 一 声 ， 所 有 的 眼睛 都 紧张 地 盯 着 他 ， 只 
见 他 挠 捞 头 ， 嘿 嘿 地 笑 道 “ 我 赌 得 少 了 ，20 亿 元 轻松 就 能 过 了 ， 我 再 加 
5 亿 元 。” 他 跑 到 白板 边 上 把 自己 的 赌注 擦 去 ， 写 上 25， 接 下 来 有 人 写 
上 28， 有 人 写 上 30， 有 人 到 微 博 上 开 下 盘 口 ， 同 事 们 纷纷 转载 下 注 。 
接 下 来 的 这 24 个 小 时 ， 战 时 指挥 部 的 工程 师 们 都 不 能 休息 ， 他 们 果 着 
网 站 的 各 种 监控 指标 ， 适 时 调整 机 器 ， 增 减 功 能 。 顶 住 第 一 疲 高 峰之 
后 ， 这 些 人 开始 忙里偷闲 地 给 自己 买 东 西 ， 大 家 互相 交流 着 哪 家 买 的 


移动 硬盘 靠 谱 ， 哪 家 衣服 适合 自己 的 女 朋 友 ， 不 时 有 人 碍 吸 贝 被 人 
抢 了 、 信 用 卡 额度 不 够 了 。 同 时 ， 旁 边 白板 上 的 赌注 越 下 越 大 。 


2 
一 一 到 


11 月 11 日 ， 这 个 棍子 最 多 的 日 子 被 网 民 自 我 调侃 地 变 成 了 一 个 节 
日 “光棍 节 ”， 而 淘宝 网 又 用 疯狂 的 折扣 促销 给 它 赋予 了 另外 一 个 
意义 “购物 狂欢 节 ”。2011 年 11 月 11 日 这 一 天 ， 淘 宝 商 城 与 淘宝 网 
交易 额 之 和 突破 52 亿 元 人 民 币 ， 这 个 数字 是 “购物 天 堂 " 香 港 一 天 零售 
总 额 8.5 亿 元 的 6 售 。 

网 民 感 受到 的 是 疯 抢 的 喜悦 ， 而 网 站 的 技术 人 员 感 受到 的 却 是 “ 压 
力 山大 ”。 就 如 同 你 家 办 酒席 ， 宣 请 左 邻 右 舍 ， 这 个 办 起 来 容易 ， 倘 若 
宴请 十 里 八 乡 所 有 的 人 ， 吃 饭 的 人 固然 开心 ， 但 却 不 是 一 般 人 家 能 够 
办 得 起 来 的 。 能 办 得 起 来 如 此 盛宴 者 ， 需 要 强大 的 财力 和 物力 、 组 织 
能 力 、 技 术 实力 (例如 做 这 么 多 菜 ， 你 的 炒 锅 一 定 要 是 “分 布 式 的 ”、 
“可 复制 的 "、“ 可 扩展 的 *， 洗 菜 和 切 菜 要 有 “工作 流 引擎 "， 跑 堂 的 要 
计算 一 下 最 优 路 径 ， 甚 至 连 厨 房 的 下 水 道 都 要 重新 设计 ) 。 


淘宝 能 够 举办 如 此 盛 窒 ， 网 站 的 技术 实力 可 见 一 斑 。 至 2011 年 年 
底 ， 淘 宝 网 拥有 全 国 最 大 的 Hadoop 分 布 式 计 算 集 群 之 一 〈2000 多 个 节 
点 ，CPU: 24000 core，Memory: 48000GB ，Disk: 24000 块 ) ,日 新 
增 数 据 50TB ， 有 40PB 海 量 数据 存储 ， 分 布 在 全 国 各 地 80 多 个 节点 的 
CDN 网 络 ， 支 撑 的 流量 超过 800Gbps。 淘 宝 的 搜索 引擎 能 够 对 数 十 亿 
的 商品 数据 进行 实时 搜索 ， 另 外 ， 还 拥有 自主 研发 的 文件 存储 系统 和 
缓存 系统 ， 以 及 Java 中 间 件 和 消息 中 间 件 系统 ， 这 一 切 组 成 了 一 个 庞 
大 的 电子 商务 操作 系统 。 从 商业 数据 上 看 ，Amazon 的 财报 显示 2011 年 
完成 了 大 约 480 亿 美元 的 交易 额 ，eBay 的 2011 年 财报 显示 全 年 完成 了 大 
约 600 亿 美元 的 交易 额 〈 不 包括 其 独立 的 汽车 交易 平台 ) 。 无 论 从 交易 
额 、 商 品 数 量 还 是 从 同比 增 速 等 指标 上 看 ， 淘 宝 网 均 远 超 于 此 ， 是 目 
前 全 球 最 大 的 电子 商务 平台 。 (由 于 淘宝 是 非 上 市 公司 ， 未 公布 2011 
年 的 业绩 ， 以 上 内 容 来 自 淘宝 网 技术 副 总 裁 @_ 行 癖 的 微 博 ) 。 

以 上 这 些 技术 数据 可 能 已 经 让 一 些 人 产生 了 不 适 的 感觉 ， 为 了 让 
更 多 的 人 读 懂 这 本 书 ， 我 们 用 下 面 这 段 文字 描述 一 下 小 美 访问 淘宝 网 
的 时 候 ， 从 技术 的 角度 来 看 ， 网 站 上 发 生 了 什么 样 的 事情 。 

参考 资料 来 自 《你 刚才 在 淘宝 上 买 了 一 件 东 西 》 (来 自 阿 里 员工 
卡特 ) 

你 发 现 快要 过 年 了 ， 于 是 想 给 你 的 女 朋 友 买 一 件 毛衣 ， 你 打开 了 
www.taobao.com ， 这 时 你 的 浏览 器 首先 查询 DNS 服务 器 ， 将 
www.taobao.com 转 换 成 耳 地 址 。 不 过 你 首先 会 发 现 ， 在 不 同 的 地 区 或 
者 不 同 的 网 络 (电信 、 联 通 、 移 动 ) 下 ， 转 换 后 的 IP 地 址 很 可 能 是 不 
一 样 的 ， 这 首先 涉及 负载 均衡 的 第 一 步 ， 通 过 DNS 解 析 域 名 时 ， 将 你 
的 访问 分 配 到 不 同 的 入 口 ， 同 时 尽 可 能 保证 你 所 访问 的 入 口 是 所 有 入 
口中 可 能 较 快 的 一 个 (这 和 后 文 的 CDN 不 一 样 ) 。 

你 通过 这 个 入 口 成 功 地 访问 了 www.taobao.com 实 际 的 入 口 卫 地 
址 ， 这 时 产生 了 一 个 PV (Page View， 页 面 访问 量 。 每 日 每 个 网 站 的 
总 PV 量 是 形容 一 个 网 站 规模 的 重要 指标 。 淘 宝 网 全 网 在 平日 〈 非 促销 
期 间 ) 的 PV 大 概 是 16~25 亿 个 之 间 ) 。 同 时 作为 一 个 独立 的 用 户 ， 你 
这 次 访问 淘宝 网 的 所 有 页 面 均 算 作 一 个 UV (Unique Visitor， 用 户 访 
问 ) 。 最 近 臭 名 昭著 的 12306.cn 的 日 PV 量 最 高 峰 在 10 亿 个 左右 ， 而 UV 
量 却 远 小 于 淘宝 网 十 余 倍 ， 这 其 中 的 原因 相信 大 家 都 知道 。 


因为 同一 时 刻 访问 www.taobao.com 的 人 数 过 于 巨大 ， 所 以 ， 即 便 
是 生成 淘宝 首页 页 面 的 服务 器 ， 也 不 可 能 仅 有 一 台 ， 仅 用 于 生成 
www.taobao.com 首 页 的 服务 器 就 可 能 有 成 百 上 千 台 ， 那 么 你 的 一 次 访 
问 时 生成 页 面 给 你 看 的 任务 便 会 被 分 配给 其 中 一 人 台 服 务 器 完成 。 这 个 
过 程 要 保证 公正 、 人 公平、 平均 〈 即 这 成 百 上 千 台 服务 器 每 台 负 担 的 用 
户 数 要 差不多 ) ， 这 一 很 复杂 的 过 程 由 几 个 系统 配合 完成 ， 其 中 最 关 
键 的 便 是 LVS (Linux Virtual Server， 世 界 上 最 流行 的 负载 均衡 系统 之 
一 ， 是 由 目前 在 淘宝 网 供职 的 章 文 高 博士 开发 的 ) 。 

经 过 一 系列 复杂 的 逻辑 运算 和 数据 处 理 ， 这 次 用 于 给 你 看 的 淘宝 
网 首页 的 HTML 内容 便 成 功 生 成 了 。 对 Web 前 端 稍 微 有 点 常识 的 人 都 
应 该 知道 ， 浏 览 器 下 一 步 会 加 载 页 面 中 用 到 的 CSS、JS 

(JavaScript) 、 图 片 等 样式 、 脚 本 和 资源 文件 。 但 是 可 能 相对 较 少 的 
人 才 会 知道 ， 你 的 浏览 器 在 同一 个 域名 下 并 发 加 载 的 资源 数量 是 有 限 
的 ， 例 如 IE 6 和 IE 7 是 两 个 ，IE 8 是 6 个 ，chrome 各 版 本 不 大 一 样 ， 一 
般 是 4 一 6 个 。 我 刚刚 看 了 一 下 ， 我 访问 淘宝 网 首页 需要 加 载 126 个 资 
源 ， 那 么 如 此 小 的 并 发 连接 数 自然 会 加 载 很 久 。 所 以 前 端 开发 人 员 往 
往 会 将 上 述 这 些 资 源 文 件 分 布 在 多 个 域名 下 ， 变 相 地 绕 过 浏览 器 的 这 
个 限制 ， 同 时 也 为 下 文 的 CDN 工 作 做 准备 。 

据 不 可 靠 消息 称 ， 在 2011 年 “ 双 十 一 ”当天 高 峰 ， 淘 宝 的 访问 流量 
最 匮 峰 达到 871GB/s， 这 个 数字 意味 着 需要 178 万 个 4MB/s 的 家 庭 宽 带 
才能 负担 得 起 ， 也 完全 有 能 力 拖 垮 一 个 中 小 城市 的 全 部 互联 网 带宽 。 
显然 ， 这 些 访问 流量 不 可 能 集中 在 一 起 ， 并 且 大 家 都 知道 ， 不 同 地 
区 、 不 同 网 络 (电信 、 联 通 等 ) 之 间 互 访 会 非常 缓慢 ， 但 是 你 却 很 少 
发 现 淘 宝 网 访问 缓慢 ， 这 便 是 CDN (Content Delivery Network， 即 内 
容 分 发 网 络 的 作用 ) 。 淘 宝 在 全 国 各 地 建立 了 数 十 个 甚至 上 百 个 CDN 
节点 ， 利 用 一 些 手 段 保 证 你 访问 的 〈 这 里 主要 指 JS、CSS、 图 片 等 ) 
站 点 是 离 你 最 近 的 CDN 节 点 ， 这 样 便 保证 了 大 流量 的 分 散 以 及 在 各 地 
访问 的 加 速 。 

这 便 出 现 了 一 个 问题 ， 那 就 是 假若 一 个 卖家 发 布 了 一 个 新 的 宝 
贝 ， 上 传 了 几 张 新 的 宝贝 图 片 ， 那 么 淘宝 网 如 何 保证 全 国 各 地 的 CDN 
节点 中 都 会 同步 存在 这 几 张 图 片 供用 户 使 用 呢 ? 这 就 涉及 大 量 的 内 容 
分 发 与 同步 的 相关 技术 。 另 外 ， 淘 宝 上 拥有 海量 的 宝贝 图 片 等 静态 文 


件 ， 这 些 文件 的 总 容量 也 达到 了 数 PB (1PB=1024TB=1048576GB) ， 
为 了 快速 存 取 这 些 文件 ， 淘 宝 开发 了 分 布 式 文件 系统 TFS (TaoBao 
File System) 来 处 理 这 类 问题 。 

好 了 ， 这 时 你 终于 加 载 完 成 淘宝 首页 ， 然 后 习惯 性 地 在 首页 搜索 
框 中 输入 “毛衣 ”二 字 并 按 回 车 键 ， 这 时 你 又 产生 了 一 个 PV， 然 后 ， 淘 
宝 网 的 主 搜索 系统 便 开始 为 你 服务 ， 它 首先 对 你 输入 的 内 容 基 于 一 个 
分 词 库 进 行 分 词 操 作 。 人 众所周知， 英文 是 以 词 为 单位 的 ， 词 和 词 之 间 
靠 空 格 隔 开 ， 而 中 文 是 以 字 为 单位 ， 句 子 中 所 有 的 字 连 起 来 才能 描述 
一 个 意思 。 例 如 ， 英 文句 子 “I am a student* 用 中 文 表示 ， 则 为 “我 是 一 
个 学 生 ”。 计 算 机 可 以 很 简单 地 通过 空格 知道 student 是 一 个 单词 ， 但 是 
不 太 容 易 明 白 “ 学 ">、“ 生 ”两 个 字 合 起 来 才 表 示 一 个 词 。 把 中 文 的 汉字 
序列 切 分 成 有 意义 的 词 ， 就 是 中 文 分 词 ， 有 些 人 也 称 为 切 词 。“ 我 是 一 
个 学 生 ” 分 词 的 结果 是 “我 是 一 个 学 生 ”。 

进行 分 词 操作 之 后 ， 还 需要 根据 你 输入 的 搜索 词 进行 购物 意图 分 
析 。 用 户 进 行 搜索 时 常常 有 如 下 几 类 意图 。 

e 浏 览 型 : 没有 明确 的 购物 对 象 和 意图 ， 边 看 边 买 ， 用 户 比 

较 随 意 和 感性 。Qnuery 广 注 1 例如 : “2010 年 10 大 香水 排行 ”、 
“2010 年 流行 毛衣 ”、“zippo 有 多 少 种 类 ? ”; 

e 查 询 型 : 有 一 定 的 购物 意图 ， 体 现在 对 属性 的 要 求 上 。 

Query 例 如 : “适合 老人 用 的 手机 *、“500 元 手表 ”; 

e 对 比 型 : 已 经 缩小 了 购物 意图 ， 有 具体 到 某 几 个 产品 。Query 

例如 :“ 诺 基 亚 E71 E63” “akg k450 px200”; 

e 人 确定 型 : 已 经 做 了 基本 决定 ， 重 点 考察 某 个 对 象 。Query 例 如 : 
“诺基亚 N97”、“IBM T60”。 

通过 对 你 的 购物 意图 的 分 析 ， 主 搜索 会 呈现 出 完全 不 同 的 结果 。 

之 后 的 数 个 步骤 后 ， 主 搜索 系统 便 根据 上 述 以 及 更 多 复杂 的 条 件 
列 出 了 搜索 结果 ， 这 一 切 是 由 一 千 多 人 台 搜 索 服 务 器 完成 的 。 然 后 你 开 
始 逐 一 点 击 浏览 搜索 出 的 宝贝 ， 查 看 宝贝 详情 页 面 。 经 常 网 购 的 亲 们 
会 发 现 ， 当 你 买 过 一 个 宝贝 之 后 ， 即 便 是 商家 多 次 修改 了 宝贝 详情 
页 ， 你 仍然 能 够 通过 “已 买 到 的 宝贝 * 查 看 当时 的 快照 。 这 是 为 了 防止 
商家 对 在 商品 详情 中 承诺 过 的 东西 赖账 不 认 。 显 然 ， 对 于 每 年 数 十 亿 


甚至 上 百 亿 笔 交 易 的 商品 详情 快照 进行 保存 和 快速 调用 不 是 一 件 简单 
的 事情 。 这 其 中 又 涉及 数 套 系统 的 共同 协作 ， 其 中 较为 重要 的 是 Tair 
(淘宝 自行 研发 的 分 布 式 KV 存储 方案 ) 。 

接 下 来 ， 无 论 你 是 否 真 的 进行 了 交易 ， 你 的 这 些 访问 行为 都 会 如 
实地 被 系统 记录 下 来 ， 用 于 后 续 的 业务 逻辑 和 数据 分 析 。 这 些 记 录 中 
的 访问 日 志 记 录 便 是 最 重要 的 记录 之 一 ， 但 是 从 前 面 我 们 得 知 ， 这 些 
访问 是 分 布 在 各 个 地 区 多 个 不 同 的 服务 器 上 的 ， 并 且 由 于 用 户 众多 ， 
这 些 日 志 记 录 都 非常 庞大 ， 达 到 TB 级 别 也 非常 正常 。 那 么 ， 为 了 快 
速 、 及 时 、 同 步 地 传输 这 些 日 志 数 据 ， 淘 宝 研发 了 TimeTunnel， 用 于 
进行 实时 的 数据 传输 ， 然 后 交 给 后 端 系统 进行 计算 报表 等 操作 。 

你 的 浏览 数据 、 交 易 数据 以 及 其 他 很 多 数据 记录 均 会 被 保留 下 
来 ， 使 得 淘宝 存储 的 历史 数据 轻而易举 地 便 达 到 了 数 十 甚至 更 多 个 
PB。 如 此 巨大 的 数据 量 存储 在 阿里 巴巴 集团 的 数据 仓库 中 ， 并 且 其 中 
有 些 数据 使 用 了 压缩 比 高 达 1: 120 的 极限 存储 技术 。 之 后 这 些 数据 会 
通过 一 个 叫做 云梯 的 基于 Hadoop 的 由 3000 多 台 服 务 器 组 成 的 超大 规模 
数据 系统 ， 以 及 一 个 基于 阿里 巴巴 集团 自主 研发 的 ODPS 系 统 的 数据 
系统 ， 不 断 地 进行 分 析 和 挖掘 。 

淘宝 从 这 些 数据 中 能 够 知道 小 到 你 是 谁 ， 你 喜欢 什么 ， 你 的 孩子 
几 风 了， 你 是 否 在 谈 恋 爱 ， 喜 欢 玩 魔兽 世界 的 人 喜欢 什么 样 的 饮料 
等 ， 大 到 各 行 各 业 的 零售 情况 、 各 类 商品 的 兴衰 消亡 等 海量 的 信息 。 

说 了 这 么 多 ， 其 实 也 只 是 叙述 了 淘宝 上 正在 运行 的 成 千 上 万 个 系 
统 中 的 窒 座 几 个 。 即 便 是 你 仅仅 访问 一 次 淘宝 的 首页 ， 所 涉及 的 技术 
和 系统 规模 都 是 你 完全 无 法 想象 的 ， 是 淘宝 2000 多 名 顶级 的 工程 师 们 
的 心血 结晶 ， 其 中 甚至 包括 长 江 学 者 、 国 家 科学 技术 最 高 奖 得 主 等 众 
多 牛人 人。 同样 ， 百 度 、 腾 讯 等 的 业务 系统 也 绝 不 比 淘 宝 简 单 。 你 需要 
知道 的 是 ， 你 每 天 使 用 的 互联 网 产品 看 似 简 单 易 用 ， 背 后 却 凝 聚 着 难 
以 想象 的 智慧 与 夯 动 。 

(本 文 所 涉及 的 技术 与 数据 均 来 源 于 互联 网 ) 

为 了 有 一 个 更 直观 的 对 比 ， 我 们 说 一 个 同行 ， 他 在 2011 年 光棍 市 
之 前 做 促销 ， 数 据 流量 达到 了 12Gbps 〈 他 们 有 这 么 大 的 流量 ， 老 板 很 
高 兴 ， 在 微 博 上 公布 了 这 个 数据 ) ， 这 时 的 流量 达到 了 极限 ， 网 站 几 
乎 挂 挤 ， 用 户 无 法 下 订单 。 而 淘宝 网 光棍 节 当 天 网 络 的 流量 最 高 达到 


800Gbps ， 带 给 各 家 银行 和 快递 公司 的 流量 也 让 他 们 如 临 大 敌 (后 
来 ， 他 们 以 能 够 撑 住 淘宝 带 来 的 流量 为 菜 而 到 处 宣传 ) 。 另 外 ， 如 果 
你 在 网 上 购买 过 火车 票 ， 更 能 体会 到 网 站 能 支持 多 大 的 流量 有 多 重 
要 。 但 这 不 是 一 朝 一 夕 就 能 做 出 来 的 ， 也 不 是 有 钱 就 能 办 到 的 。 

以 上 对 比 的 这 些 网 站 ， 也 许 读者 很 容易 就 能 猜 到 是 哪 一 家 ， 这 里 
绝对 没有 嘲笑 他 们 的 意思 ， 采 用 通常 的 网 站 技术 方案 能 做 到 这 种 程度 
已 经 不 错 了 。 任 何 网 站 的 发 展 都 不 是 一 跳 而 就 的 ， 通 常 是 在 什么 阶段 
采用 什么 技术 。 在 发 展 的 过 程 中 ， 网 站 会 遇 到 各 种 各 样 的 问题 ， 正 是 
这 些 原 因 才 推动 着 技术 的 进步 和 发 展 ， 而 技术 的 发 展 反 过 来 又 会 促进 
业务 的 更 大 提升 。 二 者 互 为 因果 ， 相 互 促进 。 如 今 淘宝 网 的 流量 已 经 
是 全 球 排名 第 12、 国 内 排名 第 3 (至 2011 年 年 底 ，eBay 全 球 排名 第 20， 
国内 前 两 名 是 百度 和 腾讯 ) 。 淘 宝 网 的 系统 也 从 使 用 一 人 台 服 务 器 ， 到 
采用 万 台 以 上 的 服务 器 。 本 书 就 为 大 家 描述 淘宝 网 在 整个 发 展 过 程 
中 ， 所 有 主动 和 被 动 的 技术 变革 的 前 因 后 果 ， 这 由 很 多 有 趣 的 故事 组 
成 。 

正如 同 很 多 人 或 组 织 成 功 了 以 后 ， 就 会 为 自己 的 出 身 编 造 一 个 美 
丽 的 传说 。 关 于 淘宝 网 的 出 身 ， 网 上 也 有 非常 多 的 传说 ， 下 面 我 们 就 
从 它 的 出 生 开始 讲 起 。 


第 1 章 个 人 网 站 


创建 一 个 小 小 的 网 站 需要 什么 技术 ? 在 群 敌 环 伺 的 状况 下 怎么 走 
出 网 站 的 第 一 步 ? 淘宝 网 独特 的 文化 和 价值 观 又 是 怎么 形成 的 ? 本 章 
试图 给 你 一 个 解读 。 

LAMP 架 构 的 网 站 

武侠 和 倒立 文化 的 起 源 

2003 年 4 月 7 日 ， 马 云 在 杭州 成 立 了 一 个 神秘 的 组 织 。 他 叫 来 十 位 
员工 ， 要 他 们 签 了 一 份 协议 ， 这 份 协议 要 求 他 们 立刻 离开 阿里 巴巴 集 
团 ， 去 做 一 个 神秘 的 项 目 。 这 个 项 目 要 求 绝 对 保密 ， 老 马戏 称 “ 连 说 梦 
话 被 老婆 听 到 都 不 行 ， 谁 要 是 透漏 出 去 ， 我 将 追 杀 到 天 涯 海 角 ”。 这 份 
协议 是 英文 版 的 ， 匆 忙 之 间 ， 大 多 数 人 根本 来 不 及 看 懂 ， 但 出 于 对 老 
马 的 信任 ， 都 卷 起 铺盖 离开 了 阿里 巴巴 。 

他 们 去 了 一 个 神秘 的 据点 一 湖畔 花园 小 区 的 一 套 未 装修 的 房子 
里 ， 房 子 的 主人 是 马云 。 这 伙 人 刚 进去 的 时 候 ， 马 云 给 他 们 布置 了 一 
个 任务 ， 就 是 在 最 短 的 时 间 内 做 出 一 个 个 人 对 个 人 “(C2C) 的 商品 交易 
的 网 站 。 这 里 出 一 个 问题 考 考 大 家 ， 看 你 适 不 适合 做 淘宝 的 创业 团 
队 : 亲 ， 要 是 让 你 来 做 ， 你 怎么 做 ? 

在 说 出 这 个 答案 之 前 ， 我 们 先 介绍 一 下 这 个 创业 团队 的 成 员 : 三 
个 开发 工程 师 〈 虚 竹 、 三 丰 、 多 隆 ) 、 一 个 UED 工 程 师 (二 当家 ) 、 
三 个 运营 工程 师 〈 小 宝 、 阿 珂 、 破 天 ) 、 一 个 经 理 (财神 ) ， 以 及 马 
云 和 他 的 秘书 。 


LAMP 架 构 的 网 站 


当时 对 整个 项 目 组 来 说 ， 压 力 最 大 的 就 是 时 间 ， 为 什么 时 间 这 么 
重要 呢 ? 火 云 收 神 先生 说 过 “天 下 武功 无 坚 不 破 ， 唯 快 不 破 ”， 还 有 一 
个 原因 就 是 当时 eBay 和 易趣 在 资本 方面 正 打 得 不 可 开交 ， 我 们 是 乘虚 
而 入 的 ， 等 他 们 反应 过 来 就 危险 了 。 那 怎么 在 最 短 的 时 间 内 把 一 个 网 
站 从 零 开 始 建立 起 来 呢 ? 了 解 淘宝 历史 的 人 都 知道 淘宝 是 在 2003 年 5 月 


10 日 上 线 的 ，2003 年 4 月 7 日 到 5 月 10 日 ， 这 之 间 只 有 一 个 月 时 间 。 要 是 
你 在 这 个 团队 里 ， 你 怎么 做 ? 不 是 “ 抄 一 个 来 "， 我 们 的 答案 是 一 一 “ 买 
一 个 来 过 

买 一 个 网 站 显然 比 作 一 个 网 站 要 省 事 ， 但 是 他 们 的 梦想 可 不 是 做 
一 个 小 网 站 而 已 ， 要 做 大 ， 就 不 是 随便 买 一 个 就 行 的 ， 要 有 比较 低 的 
维护 成 本 ， 要 能 够 方便 地 扩展 和 二 次 开发 。 那 么 接 下 来 就 是 第 二 个 问 
题 : 买 一 个 什么 样 的 网 站 ? 答案 是 : 轻 量 一 点 的 ， 简 单一 点 的 。 于 是 
买 了 这 样 一 个 架构 的 网 站 : LAMP (Linux+Apache+MySQL+PHP) ， 
这 个 直到 现在 还 是 一 个 很 常用 的 网 站 架构 模型 ， 其 优点 是 : 无 须 编 
译 ， 发 布 快速 ，PHP 语 言 功 能 强大 ， 能 做 从 页 面 泻 染 到 数据 访问 所 有 的 
事情 ， 而 且 用 到 的 技术 都 是 开源 、 免 费 的 。 

当时 我 们 是 从 一 个 美国 人 那里 买 来 的 一 个 网 站 系统 ， 这 个 系统 的 
名 字 叫 做 PHPAuction (其 官方 网 站 http: //www.phpauction.net，Auction 
即 是 拍卖 的 意思 ， 这 个 名 字 很 直 白 ， 一 眼 就 可 看 出 这 个 系统 是 用 什么 
语言 做 的 、 用 途 是 什么 ) ，PHPAuction 有 好 几 个 版 本 ， 我 们 买 的 是 最 
高 版 的 ， 功 能 比较 多 ， 而 且 最 重要 的 是 对 方 提 供 了 源 代码 。 最 高 的 版 
本 比较 贵 ， 花 了 我 们 差不多 2000 美 元 (貌似 现在 降价 了 ， 只 要 946 美 
元 ， 在 他 们 的 网 站 上 有 明码 标价 的 信息 ) 。 买 来 之 后 不 是 直接 就 能 
的 ， 需 要 很 多 本 地 化 的 修改 ， 例 如 ， 修 改 一 些 数 据 类 型 ， 增 加 后 台 管 
理 的 功能 ， 页 面 模 板 改 得 漂亮 一 点 ， 页 眉 和 页 脚 加 上 自己 的 站 点 简介 
等 。 其 中 最 有 技术 含量 的 是 对 数据 库 进 行 了 一 个 修改 ， 原 来 是 从 一 个 
数据 库 进行 所 有 的 读 写 操作 ， 现 在 把 它 拆 分 成 一 个 主 库 、 两 个 从 库 ， 
并 且 读 写 分 离 。 这 么 做 的 好 处 有 几 点 : 存储 容量 增加 了 ， 有 了 备份 ， 
使 得 安全 性 增加 了 ， 读 写 分 离 使 得 读 写 效率 得 以 提升 〈 写 要 比 读 更 加 
消耗 资源 ， 分 开 后 互 不 干扰 ) 。 这 样 整个 系统 的 架构 就 如 下 图 所 示 。 


Apache 


其 中 ，pear DB 是 一 个 PHP 模 块 ， 负 责 数据 访问 层 。 另 外 ， 他 们 也 
用 开源 的 论坛 系统 PHPBB (http: /www.phpbbchina.com) 搭建 了 一 个 
小 的 论坛 社区 ， 在 当时 ， 论 坛 几乎 是 所 有 网 站 的 标 配 。 虚 竹 负责 机 器 
采购 、 配 置 、 架 设 等 ， 三 丰 和 多 隆 负责 编码 ， 他 们 把 交易 系统 和 论坛 
系统 的 用 户 信息 打通 ， 给 运营 人 员 开 发 出 后 台 管理 的 功能 (Admin 系 
统 ) ， 把 交易 类 型 从 只 有 拍卖 这 一 种 增加 为 拍卖 、 一 口 价 、 求 购 商 
品 、 海 报 商 品 (意思 是 还 没 推出 的 商品 ， 先 挂 个 海报 出 来 ， 这 是 快速 
增加 商品 数 的 一 个 好 方法 ) 四 种 。 (PHPAuction 系 统 里 只 有 拍卖 的 交 
易 ，Auction 即 拍卖 的 意思 。@ _ 行 癫 在 微 博 中 提 到 : 今天 ，eBay 所 有 的 
交易 中 ， 拍 卖 交 易 仍然 占 40%， 而 在 中 国 ， 此 种 模式 在 淘宝 几乎 从 一 开 
台 就 未 能 占据 优势 ， 如 今 在 主流 的 交易 中 几乎 可 以 忽略 不 计 。 背 后 的 
原因 一 直 令 人 费解 ， 我 大 致 可 以 给 出 其 中 一 种 解释 ，eBay 基 本 上 只 在 
发 达 国 家 展开 业务 ， 制 造 业 外 包 后 ， 电 子 商 务 的 基本 群体 大 多 只 能 表 
现 为 零散 的 个 体 间 交 易 。) 

在 开发 过 程 中 ， 这 个 项 目的 代号 是 BMW ( 没 错 ! 就 是 宝马 的 意 
思 ) 。 这 个 是 二 当家 提出 的 建议 ， 二 当家 特别 喜欢 宝马 ， 他 希望 我 们 


的 网 站 也 如 同 宝马 一 样 漂亮 、 快 速 、 安 全 ， 充 满 乐趣 。 二 当家 现在 的 
座驾 就 是 一 辆 宝马 X5， 算 是 得 偿 所 愿 了 。 在 上 线 的 时 候 需 要 给 这 个 网 
站 取 个 名 字 ， 为 了 不 引起 eBay 的 注意 ， 这 个 名 字 要 撤 开 与 阿里 巴巴 的 
天 系 ， 所 以 “阿里 爷爷" “阿里 田 舅 ”之 类 的 域名 是 不 能 用 的 。 这 时 候 ， 
美女 阿 珂 提供 了 一 个 很 好 听 的 名 字 “ 淘 宝 ”。 因 为 她 家 里 有 人 热爱 收藏 
古董 ， 经 常 去 市 场 上 淘宝 贝 ， 而 她 本 人 也 非常 热爱 得 街 ， 享 受 “ 淘 ”的 
乐趣 ， 她 觉得 “淘宝 ”两 个 字 特 别 符合 网 站 的 定位 〈 阿 珂 说 想到 这 个 名 
字 的 时 候 ， 脑 子 里 一 道内 电 臂 过 ， 真 的 是 “灵光 一 内 ”。 后 来 " 文 付 宝 ” 的 
名 字 也 是 阿 珂 取 的 ) 。 于 是 这 个 大 名 就 定 了 下 来 ， 淘 宝 网 横 空 出 世 


| 儿 夫 导热 的 商品 类 日 加 
索尼 DCE-YX2000 、 


日 本 最 新 科技 # 索尼 公司 
荣 警 出品 ? 全 新 ,没有 使 


过 ? 
一 口 价 : 则 2000/ 吏 


在 接 下 来 的 大 半年 时 间 里 ， 这 个 网 站 迅速 显示 出 了 它 的 生机 。 这 
里 有 必要 提 一 下 当时 的 市 场 环境 ， 非 典 (SARS) 的 肆虐 使 得 大 家 都 不 
敢 出 门 ， 尤 其 是 去 类 似 商场 等 人 多 的 地 方 。 另 外 ， 在 神州 大 地 上 最 早 
出 现 的 C2C 网 站 易趣 也 正 忙 得 不 亦 乐 平 ，2002 年 3 月 ，eBay 以 3000 万 美 
元 收购 了 易趣 公司 33% 的 股份 ，2003 年 6 月 以 1.5 亿 美元 收购 了 易趣 公司 
剩余 67% 的 股份 。 当 时 ， 淘 宝 网 允许 买卖 双方 留 下 联系 方式 ， 人 允许 同城 
交易 ， 整 个 操作 过 程 简单 轻松 。 而 eBay 是 收费 的 ， 为 了 收取 交易 佣 
金 ，eBay 禁 止 买 卖 双 方 这 么 做 ， 这 必然 增加 了 交易 过 程 的 难度 。 而 且 
eBay 为 了 全 球 统一 ， 把 易趣 原来 的 系统 替换 成 了 美国 eBay 的 系统 ， 用 
户 体验 一 下 全 变 了 ， 操 作 起 来 非常 麻烦 ， 很 多 易趣 的 卖家 在 那 边 都 混 
不 下 去 了 ， 这 等 于 是 把 积累 的 用 户 拱手 送 给 了 淘宝 。 为 了 不 引起 eBay 
的 注意 ， 淘 宝 网 在 2003 年 里 一 直 声 称 自己 是 一 个 “个 人 网 站 ”。 由 于 这 
个 创业 团队 强大 的 市 场 开拓 和 运营 能 力 ， 淘 宝 网 的 发 展 非常 迅猛 ， 
2003 年 年 底 就 吸引 了 注册 用 户 23 万 个 ， 每 日 31 万 个 PV， 从 2003 年 5 月 到 
同年 年 底 成 交 额 达 3371 万 元 。 这 没有 引起 eBay 的 注意 ， 却 引起 了 阿里 
巴巴 内 部 很 多 员工 的 注意 ， 他 们 觉得 这 个 网 站 以 后 会 成 为 阿里 巴巴 强 
劲 的 对 手 ， 甚 至 有 人 在 内 网 发 帖 ， 忠 告 管 理 层 要 警惕 这 个 刚刚 起 步 的 
网 站 ， 但 管理 层 似乎 无 动 于 夷 。 (这 个 团队 的 保密 工作 做 得 真 好 ! ) 


GMV 戊 区 金额 一 3371 万 


武侠 和 倒立 文化 的 起 源 


在 市 场 和 运营 的 后 方 ， 淘 宝 网 的 技术 团队 也 在 快速 地 做 着 系统 的 
改进 和 创新 。 这 里 还 有 一 个 有 趣 的 故事 ，eBay 和 易趣 早期 都 有 员工 在 
论坛 上 响应 用 户 的 需求 ，eBay 的 论坛 用 粉红 色 背 景 来 区 分 员工 的 发 
言 ， 易 趣 的 员工 在 论坛 上 的 昵称 都 选 各 种 豆 豆 ， 例 如 “黄豆 豆 ” “等 豆 
豆 ”“ 黑 眼 辟 豆 ” 等 。 淘 宝 在 讨论 运营 策略 的 时 候 提 到 这 个 问题 ， 老 马 
也 要 求 所 有 的 员工 都 去 论坛 上 回答 用 户 的 问题 。 最 早 回 丛 问题 的 任务 
落 在 小 宝 头 上 ， 我 们 用 什么 名 字 好 呢 ?“ 淘 淘 ” “宝宝 ”、“ 淘 宝宝 ”、 
“宝宝 淘 ”? 小 宇都 不 满意 ， 认 为 太 女 性 化 了 ， 厂 没 了 他 堂堂 一 个 七 尺 
汉子 。 讨 论 了 很 久之 后 ， 小 宇 灵 光 乍 现 ， 干脆 取 个 名 字 叫 “小 宝 ” 吧 ， 
小 宝 融 七 个 老 婆 来 开店 ， 迎 接 各 位 客 官 ， 很 有 故事 性 和 现场 感 。 于 是 


接 下 来 很 多 武侠 小 说 中 的 人 物 开 始 在 淘宝 论坛 中 行 侠 仗义 ， 这 些 昵称 
下 面 标志 着 “淘宝 店 小 二 ”， 他 们 回答 着 各 种 各 样 的 问题 ， 快 速 响应 着 
用 户 的 各 种 需求 。 如 果 是 技术 上 能 解决 的 ， 几 个 人 商量 一 下 ， 马 上 就 
开发 、 测 试 、 发 布 上 线 。 公 司 给 这 几 个 人 租 了 房子 ， 他 们 合 住 在 湖上 昱 
花园 旁边 的 小 区 里 (男女 分 开 ) ， 每 天 睁 开眼 就 去 公司 ， 半 夜 两 三 点 
收工 睡觉 ， 响 应 用 户 的 需求 非常 快 。 反 过 来 对 比 一 下 ， 易 趣 被 eBay 收 
购 之 后 ， 系 统 更 换 成 了 全 球 通用 的 版 本 ， 响 应 用 户 的 一 个 需求 需要 层 
层 审批 ， 据 说 ， 买 个 办 公 毕 都 要 走 两 个 月 流程 ， 反 应 速度 自然 慢 了 下 
来 。 

当时 淘宝 第 一 个 版 本 的 系统 中 已 经 包含 了 商品 发 布 、 管 理 、 搜 
索 、 商 品 详情 、 出 价 购买 、 评 价 投诉 、 我 的 淘宝 等 功能 〈 现 在 主流 程 
中 也 是 这 些 模块 。 在 2003 年 10 月 增加 了 一 个 功能 节点 :“ 安 全 交易 ”， 
这 是 支付 宝 的 雏形 ) 。 随 着 用 户 需 求 和 流量 的 不 断 增长 ， 系 统 做 了 很 
多 日 党 改进， 服务 器 由 最 初 的 一 台 变 成 了 三 台 ， 一 台 负 责 发 送 Email、 
一 台 负 责 运 行 数据 库 、 一 台 负 责 运行 WebApp。 一 段 时 间 之 后 ， 商 品 搜 
索 的 功能 占用 数据 库 资 源太 大 了 (用 like 搜 索 的 ， 很 慢 ) ，2003 年 7 
月 ， 多 隆 又 把 阿里 巴巴 中 文 站 的 搜索 引擎 iSearch 搬 了 过 来 。 

如 此 快 节奏 的 工作 ， 其 实 大 家 都 累 得 不 轻 ， 有 人 就 提议 大 家 随时 
随地 锻炼 身体 ， 可 是 当时 SARS 横 行 ， 在 一 个 一 百 多 平方 米 的 房子 里 ， 
怎么 锻炼 呢 ? 高 挑 美女 阿 珂 提议 大 家 练习 提 臂 操 ， 这 样 有 助 于 保持 身 
材 ， 这 个 建议 遭 到 男士 的 一 致 反对 ， 后 来 虚 竹 就 教 大 家 练习 倒立 ， 这 
个 大 家 都 能 接受 。 于 是 这 个 倒立 的 传统 一 直 延 续 至 今 ， 与 花 名 文化 、 
武侠 文化 一 并 传承 了 下 来 。 

随 着 访问 量 和 数据 量 的 飞速 上 涨 ， 问 题 很 快 就 出 来 了 ， 第 一 个 问 
题 出 现在 数据 库 上 。MySQL 当 时 是 第 4 版 的 ， 我 们 用 的 是 默认 的 存储 引 
擎 MyISAM， 这 种 存储 引擎 在 写 数据 的 时 候 会 把 表 锁 住 。 当 Master 同 步 
数据 到 Slave 的 时 候 ， 会 引起 Slave 写 ， 这 样 在 Slave 的 读 操作 都 要 等 待 。 
还 有 一 点 是 会 发 生 Slave 上 的 主键 冲突 ， 经 常会 导致 同步 停止 ,这样 ， 
你 发 布 的 一 些 东西 明明 已 经 成 功 了 ， 但 就 是 查询 不 到 。 另 外 ， 当 年 的 
MySQL 不 比如 今 的 MySQL ， 在 数据 的 容量 和 安全 性 方面 也 有 很 多 先天 
的 不 足 (和 Oracle 相 比 ) 。 


第 2 章 个 人 网 站 的 升级 


小 网 站 都 想 变 大 ， 变 大 总 会 遇 到 成 长 的 烦恼 ， 淘 宝 网 的 青春 期 有 
哪些 烦心 事 ? 淘宝 网 的 工程 师 用 什么 思路 来 解决 遇 到 的 问题 ? 在 解决 
问题 之 余 ， 他 们 又 用 了 哪些 创新 的 手段 来 超越 竞争 对 手 ? 

数据 库 从 mySQL 到 Oracle 

支付 手段 的 创新 一 一 支付 宝 

交流 方式 的 创新 一 一 淘宝 旺旺 

讲 到 这 里 ， 顺 便 先 辟 个 谣 ， 网 上 有 很 多 这 样 骗 转发 的 励志 上 段子: 
“1998 年 ， 马 化 腾 等 一 伙 人 凑 了 50 万 元 创办 了 腾讯 ， 没 买房 ;1998 年 ， 
史玉柱 借 了 50 万 元 搞 脑 白金 ， 没 买房 ;1999 年 ， 丁 和 兢 用 50 万 元 创办 了 
163.com， 没 买房 ，1999 年 ， 陈 天 桥 炒 股 赚 了 50 万 元 ， 创 办 盛大 ， 没 买 
房 ; 1999 年 ， 马 云 等 18 人 凑 了 50 万 元 注册 了 阿里 巴巴 ， 没 买房 。 如 果 
当年 他 们 用 这 50 万 元 买 了 房 ， 现 在 估计 还 在 还 着 银行 的 贷款 吧 。” 事 实 
上 ， 阿 里 巴巴 和 淘宝 网 都 是 在 马云 自己 的 房子 里 创办 的 ， 阿 里 巴巴 是 
1999 年 初 发 布 上 线 的 。 所 以 ， 关 于 马云 买房 子 的 事情 ， 真 相 是 这 样 
的 。 

淘宝 网 作为 个 人 网 站 发 展 的 时 间 其 实 并 不 长 ， 由 于 它 太 引 人 注 目 
了 ， 马 云 在 2003 年 7 月 就 宣布 这 个 是 阿里 巴巴 旗下 的 网 站 ， 随 后 在 市 场 
上 展开 了 很 成 功 的 推广 运作 。 最 著名 的 就 是 利用 中 小 网 站 来 做 广告 ， 
突围 eBay 在 门户 网 站 上 对 淘宝 的 广告 封锁 。 这 时 候 ，eBay 终 于 看 到 淘 
宝 网 这 个 后 起 之 秀 了 ， 他 对 竞争 者 的 态度 就 是 “封杀 他 ”。eBay 买 断 了 
新 浪 、 搜 狐 、 网 易 的 电子 商务 类 型 的 广告 ， 签 署 了 排他 性 协议 ， 切 断 
了 淘宝 在 这 上 面 做 广告 的 路 子 。 大 路 不 通 ， 我 们 就 独辟蹊径 ， 上 网 比 
较 早 的 人 应 该 还 记得 那些 在 右 下 角 的 弹 窗 和 网 站 腰 封 上 一 内 一 内 的 广 
告 , “淘宝 网 ?” 几 个 字 总 是 如 影 随 形 地 出 现在 任何 中 小 型 网 站 上 。 市 场 
部 那 位 到 处 花 钱 买 广告 的 家 伙 太 能 花 钱 了 ， 一 出 手 就 是 几 百 万 元 ,他 
被 我 们 称 为 “大 少爷 ”。 


数据 库 从 mySQL 到 Oracle 


“大 少 仓 ” 们 做 的 广告 ， 带 来 的 就 是 迅速 上 涨 的 流量 和 交易 量 。 在 
2003 年 年 底 ，MySQL 已 经 撑 不 住 了 ， 技 术 的 替代 方案 非常 简单 ， 就 是 
换 成 Oracle。 换 为 Oracle 的 原因 除了 它 容量 大 、 稳 定 、 安 全 、 性 能 高 
外 ， 还 有 人 才 方 面 的 原因 。 在 2003 年 的 时 候 ， 阿 里 巴巴 已 经 有 一 支 很 
强大 的 DBA 团 队 了 ， 有 和 鲁 国 恨 、 冯 春 培 、 汪 海 (七 公 ) 这 样 的 人 物 ， 
后 来 还 有 冯 大 辉 (@fenng) 、 陈 吉平 〈 拖 雷 ) 。 这 样 的 人 物 牛 到 什么 
程度 呢 ? Oracle 给 全 球 的 技术 专家 颁发 一 些 头 衔 ， 其 中 最 高 级 别 的 叫 
ACE (就 是 扑克 上牌 的 “ 尖 儿 ”， 够 大 的 吧 ) ， 被 授予 这 个 头衔 的 人 目前 
全 球 也 只 有 300 多 名 (公布 名 单 的 网 址 为 : 
http : /Wapex.oracle.comypls/otn/f? p=19297: 3) ， 当 年 全 球 只 有 十 几 
名 ， 而 阿里 巴巴 就 有 4 名 。 有 如 此 强大 的 技术 后 盾 ， 把 MySQL 换 成 
Oracle 是 顺理成章 的 事情 。 

但 更 换 数据 库 不 是 只 换个 库 就 可 以 的 ， 其 访问 方式 和 SQL 语法 都 
要 跟着 变 ， 最 重要 的 一 点 是 ，Oracle 的 性 能 和 并 发 访问 能 力 之 所 以 如 
此 强大 ， 有 一 个 关键 性 的 设计 一 一 连接 闻 ， 连 接 闻 中 放 的 是 长 连接 ， 
是 进程 级 别 的 ， 在 创建 进程 的 时 候 ， 它 就 要 独占 一 部 分 内 存 空间 。 也 
就 是 说 ， 这 些 连 接 数 在 固定 内 存 的 Oracle Server 上 是 有 限 的 ， 任 何 一 个 
请 求 只 需要 从 连接 闻 中 取得 一 个 连接 即 可 ， 用 完 后 释放 ， 这 不 需要 频 
每 地 创建 和 断 开 和 连接， 而 连接 的 创建 和 断 开 的 开销 是 非常 大 的 。 但 对 
于 PHP 语 言 来 说 ， 它 对 数据 库 的 访问 都 是 很 直接 的 ， 每 一 个 请 求 都 要 
一 个 连接 。 如 果 是 长 连接 ， 应 用 服务 器 增多 时 ， 连 接 数 就 多 了 ， 就 会 
把 数据 库 拖 挂 ， 如 果 是 短 连 接 ， 频 每 地 连接 后 再 断 开 ， 性 能 会 非常 差 

(而 Java 语 言 有 很 多 现成 的 连接 池 ) 。 那 如 何 是 好 呢 ? 我 们 打探 到 
eBay 用 了 一 个 连接 池 的 工具 ， 是 BEA 卖 给 他 们 的 。 我 们 知道 ，BEA 的 
东西 都 很 贵 ， 我 们 买 不 起 ， 就 放弃 了 找 BEA 的 念头 ， 于 是 多 隆 在 网 上 
寻 寻 有 册 员 ,找到 一 个 开源 的 连接 闻 代 理 服务 SQL Relay 

(http : //sqlrelay.sourceforge.net) ， 这 个 东西 能 够 提供 连接 闻 的 功 
能 ， 多 隆 对 它 进行 了 一 些 功 能 改进 之 后 ， 系 统 的 架构 就 变 成 了 如 下 形 
式 。 


Apa 


mod 
mod Apache 
| 


pea 


peal ~ mod_php4 


= SQL | pear DB 


SQL Relay 


数据 一 开始 是 放 在 本 地 的 ， 七 公 带 领 的 DBA 们 对 Oracle 做 调 优 的 
工作 ， 也 对 SQL 进 行 调 优 。 后 来 数据 量变 大 后 ， 本 地 存储 无 法 满足 
了 ， 买 了 NAS (Network Attached Storage， 网 络 附属 存储 ) ，NetApp 

(Network Appliance， 美 国 网 域 存储 技术 有 限 公 司 ) 的 NAS 作 为 数据 
库 的 存储 设备 ， 加 上 Oracle RAC (Real Application Clusters， 实 时 应 用 
集群 ) 来 实现 负载 均衡 。 七 公 说 这 实际 上 是 走 了 一 段 弯路 ，NAS 的 
NFS (Network File System) 协议 传输 的 延迟 很 严重 ,但 那 时 不 懂 。 后 
来 采购 了 Dell 和 EMC 合 作 的 SAN 低 端 存 储 ， 性 能 一 下 提升 了 十 几 倍 ， 
这 才 比 较 稳 定 了 。 再 后 来 ， 数 据 量 更 大 了 ， 人 存储 的 节点 一 拆 二 、 二 拆 
四 ，RAC 又 出 问题 了 ， 这 才 踏 上 了 购买 小 型 机 的 道路 。 在 那 段 不 稳定 
的 时 间 里 ， 七 公 曾 经 在 机 房 住 了 5 天 5 夜 ， 差 点 被 辐射 成 蜂 蛛 侠 。 

替换 完 数 据 库 后 ， 时 间 到 了 2004 年 春天 ， 俗 话说 “春宵 一 刻 值 干 
金 *"， 但 这 些 人 的 春宵 却 不 太 好 过 ， 他 们 在 把 数据 的 连接 放 在 SQL 
Relay 之 后 就 绪 梦 不 断 ， 这 个 代理 服务 经 常会 死 锁 ， 如 同 之 前 的 
MySQL 死 锁 一 样 。 虽 然 多 隆 做 了 很 多 修改 ， 但 当时 那个 版 本 内 部 处 理 
的 逻辑 不 对 ， 问 题 很 多 ， 最 快 的 解决 办 法 就 是 “重启 ” 它 的 服务 。 这 在 
白天 还 好 ， 只 要 连接 上 机 房 的 服务 器 ， 把 进程 杀 掉 ， 然 后 开启 就 可 以 


了 。 但 是 最 痛苦 的 是 它 在 晚上 也 要 死 掉 ， 于 是 工程 师 们 不 得 不 24 小 时 
开 着 手机 ， 一 旦 收 到 “SQL Relay 进 程 挂 起 ”的 短信 ， 就 从 春梦 中 醒 来 ， 
打开 电脑 ， 连 上 机 房 的 网 络 ， 重 启 服务 ， 后 来 干脆 每 天 睡觉 之 前 先 重 
启 一 下 。 做 这 事 最 多 的 据说 是 三 丰 ， 他 现在 是 淘宝 网 的 总 裁 。 现 在 我 
们 知道 ， 任 何 牛 B 的 人 物 ， 都 有 一 段 苦 B 的 经 历 。 


支付 手段 的 创新 一 一 支付 宝 


微 博 上 有 人 说 “好 的 架构 是 进化 来 的 ， 不 是 设计 来 的 ">。 的 确 如 
此 ， 其 实 还 可 以 再 加 上 一 句 “ 好 的 功能 也 是 进化 来 的 ， 不 是 设计 来 
的 ”"。 在 架构 的 进化 过 程 中 ， 业 务 的 进化 也 非常 迅猛 。 最 早 的 时 候 ， 买 
家 打 钱 给 卖家 都 是 通过 银行 转账 汇款 ， 有 些 骗子 收 了 钱 却 不 发 货 ， 
脆 逃 之 天 天 。 这 是 一 个 很 严重 的 问题 ， 一 个 人 这 么 干 了 之 后 ， 很 快 就 
有 更 多 的 人 学 会 了 (这 就 是 传说 中 的 “病毒 传播 > 。 然 而 魔 高 一 尺 ， 
道 高 一 丈 ， 淘 宝 网 这 伙 人 开始 研究 防 骗子 的 解决 方案 ， 他 们 看 了 
PayPal 的 支付 方式 ， 发 现 不 能 解决 问题 。 研 究 了 类 似 QQ 币 的 东西 ， 想 
弄 个 “淘宝 币 ” 出 来 ， 发 现 也 不 行 。 后 来 这 几 个 聪明 的 脑袋 把 这 些 想法 
尺 合 起 来 ， 突 然 想到 了 “担保 交易 ”这 种 第 三 方 托 管 资 金 的 办 法 。 于 是 
在 2003 年 10 月 ， 淘 宝 网 上 线 了 一 个 功能 ， 叫 做 “安全 交易 ”， 卖 家 如 果 
选择 支持 这 种 功能 ， 买 家 就 会 把 钱 交 给 淘宝 网 ， 等 他 收 到 货 之 后 ， 淘 
宝 网 再 把 钱 给 卖家 ， 这 就 是 现在 的 “支付 宝 ”*。 这 个 功能 最 早 是 让 卖家 
可 选 的 ， 因 为 这 会 延 返 他 收 款 的 周期 。 但 一 旦 卖家 用 了 这 个 之 后 ， 就 
发 现 交易 量 猛 增 ， 一 年 之 后 ， 几 乎 所 有 的 卖家 都 选择 担保 交易 ， 到 后 
来 干脆 所 有 的 交易 都 必须 走 担 保 交 易 。 在 2012 年 支付 宝 的 年 会 上 ， 支 
付 宝 公布 2011 年 的 交易 笔 数 已 经 是 PayPal 的 两 倍 。 这 个 划时代 的 创 
新 ， 其 实 就 是 在 不 断 思 索 过 程 中 的 一 个 灵光 乍 现 。 

当时 开发 “安全 交易 ”功能 的 是 茅 十 八 和 他 的 徒弟 苗 人 凤 ( 茅 十 八 
开发 到 一 半 去 上 海 读 MBA 了 ， 苗 人 凤 现 在 是 支付 宝 的 首席 业务 架构 
师 ) ， 开 发 与 银行 网 关 对 接 功 能 的 是 多 隆 。 当 时 多 数 银行 的 网 站 已 经 
支持 在 线 支 付 了 ， 但 多 隆 告诉 我 ， 他 们 的 网 关 五 花 八 门 ， 用 什么 技术 
的 都 有 ， 我 们 必须 一 家 一 家 地 去 接 。 而 且 银 行 的 网 关 不 保证 用 户 付 钱 
后 就 一 定 能 扣 款 成 功 ， 不 保证 扣 款 成 功 后 就 一 定 通知 淘宝 ， 也 不 保证 


通知 淘宝 后 就 一 定 能 通知 到 ， 以 及 不 保证 通知 到 了 就 不 重复 通知 。 这 
害 音 了 苗 人 凤 ， 他 必须 每 天 手工 核对 账单 ， 少 一 分 钱 都 睡 不 着 觉 ， 
为 对 不 齐 账 就 一 定 是 有 人 的 钱 找 不 到 地 方 了 ， 这 可 是 天 大 的 问题 。 另 
外 ， 他 为 了 测试 这 些 功能 ， 去 杭州 所 有 的 银行 都 办 理 了 一 张 银 行 卡 。 
一 大 堆 银 行 卡 摆 在 桌子 上 ， 不 知道 的 人 还 以 为 他 一 定 很 有 钱 《高 富 帅 
啊 ) ， 其 实 里 面 都 只 是 十 元 八 元 的 。 现 在 我 们 再 一 次 知道 ， 任 何 牛 B 
的 和 人物， 都 必须 有 一 段 杏 B 的 经 历 。 


交流 方式 的 创新 一 一 淘宝 旺旺 


有 人 说 淘宝 打败 易趣 (eBay 中 国 ) 是 靠 免费 ， 其 实 这 只 是 原因 之 
一 。 如 果 说 和 易趣 过 招 的 第 一 招 是 免费 ， 这 让 用 户 无 须 成 本 就 能 进 
来 ， 那 么 第 二 招 就 是 “安全 支付 "， 这 让 用 户 放 心 付款 ， 不 必 担 心 被 
骗 。 在 武侠 小 说 中 ， 真 正 的 高 手 飞 花 摘 叶 即 可 伤 人 ， 他 们 不 会 局 限于 
一 两 招 ， 一 旦 出 手 ， 则 连绵 不 绝 。 而 淘宝 的 第 三 招 就 是 “旺旺 ”。 其 实 
淘宝 旺旺 也 不 是 自己 生出 来 的 ， 是 从 阿里 巴巴 的 “贸易 通 ” 复 制 过 来 
的 。 从 2004 年 3 月 开始 ,“ 叮 降 ! 叮 噬 ! ”这 个 经 典 的 声音 就 回荡 在 所 有 
淘宝 买 家 和 卖家 的 耳 边 ,，“ 亲 ， 包 邮 不 ? ”“ 亲 ， 便 宜 5 毛 行 不 ? ”这 亲切 
的 砍 价 声 造 就 了 后 来 的 “淘宝 体 "。 有 人 说 中 国人 就 是 爱 砍 价 ， 虽 然 笔 
者 体会 不 到 砍 价 成 功 后 有 多 少 成 就 感 ， 但 每 次 我 去 菜市 场 ， 看 到 大 妈 
们 砍 价 砍 得 天 缠 地 上 暗 ， 那 满足 的 劲头 堪 比 捡 到 了 钱 ， 我 就 深刻 地 理解 
了 淘宝 旺旺 在 交易 过 程 中 的 价值 。 我 猜 eBay 也 体会 不 到 砍 价 的 乐趣 ， 
他 们 一 直 不 允许 买卖 双方 在 线 聊天 ， 收 购 了 Skype 之 后 也 没有 用 到 电子 
商务 中 去 。 

旺旺 在 推出 没 多 久 ， 就 若 了 一 个 法 律 方面 的 及 烦 。 有 个 做 雪 饼 的 
广 家 找 上 门 来 ， 说 我 们 侵权 了 ， 他 们 家 的 雪 饼 很 好 吃 ， 牛 奶 也 做 得 不 
错 ， 我 们 都 很 喜欢 。 然 后 我 们 就 在 旺旺 的 前 面 加 了 两 个 字 ， 叫 做 “淘宝 
旺旺 ”。 最 早 做 旺旺 开发 的 人 只 有 一 个 一 一 无 岸 子 ， 我 们 叫 他 “旺旺 之 
父 ”，， 为 了 支持 他 的 工作 ， 我 们 工作 用 的 IM 工 具 仪 限于 旺旺 ， 旺 旺 在 
线 效 上 新 高 之 后 ， 他 请 我 们 吃 鸭 脾 子 。 有 时 候 为 了 吃 到 鸭 膀 子 ， 我 们 
盯 着 在 线 数 看 ， 快 到 整数 量 的 时 候 ， 自 己 赶 紧 去 挂 几 个 小 号 上 去 。 还 
有 一 个 很 卡 哇 伊 的 设计 师 MM 一 一 奇 灵 ， 开 发 出 了 一 套 旺旺 表情 ， 这 


套 表 情 比 所 有 的 聊天 软件 的 表情 都 大 ， 也 更 加 生动 ， 一 直 治 用 到 现 
在 ， 我 们 叫 奇 灵 为 “旺旺 之 母 ”。 


OO 
类 刁 二 办 合 舍 昌 信 翅 
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在 那个 野蛮 生长 的 阶段 ， 其 实 很 多 产品 都 是 想到 什么 就 做 什么 ， 
例如 ， 我 们 还 搭建 过 一 个 聊天 室 ， 但 似乎 淘宝 网 不 是 一 个 闲聊 的 地 
方 ， 这 个 聊天 室 门 可 罗 雀 ， 一 段 时 间 后 就 关闭 掉 了 。 

SQL Relay 的 问题 搞 得 三 丰 等 人 很 难 睡 个 贺 固 觉 ， 那 一 年 开 半年 会 
的 时 候 ， 公 司 特地 给 三 丰 颁 了 一 个 奖项 ， 对 他 表示 深切 的 安慰 。 但 不 
能 总 这 样 通过 不 断 地 重启 来 保证 系统 的 稳定 性 。 于 是 ，2004 年 上 半年 
开始 ， 整 个 网 站 就 开始 了 一 个 脱胎 换 骨 的 手术 。 


第 3 章 企业 级 Java 网 站 


给 一 个 网 站 更 换 开 发 语言 ， 这 种 事情 想 想 都 恐怖 ， 淘 军 网 在 2004 
年 就 从 PHP 语 言 转换 成 了 Java 语 言 ， 这 是 怎么 做 到 的 ?一 个 企业 级 的 
Java 系 统 应 该 采用 什么 样 的 架构 ? 归纳 网 站 遇 到 的 问题 ， 主 要 是 对 性 
能 、 容 量 和 成 本 的 控制 ， 这 有 哪些 通用 的 解决 方案 ”在 技术 实力 得 到 
提升 之 后 ， 淘 宝 网 的 哪些 业务 有 了 突飞猛进 的 发 展 ? 哪些 业务 又 会 遇 
到 技术 的 障碍 ? 


脱胎 换 骨 的 升级 一 一 更 换 开 发 语言 
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我 的 师父 黄 党 曾经 说 过 “好 的 架构 图 充满 美感 "。 一 个 架构 好 不 
好 ， 从 审美 的 角度 就 能 看 出 来 。 后 来 我 看 了 很 多 系统 的 架构 ， 发 现 这 
个 言论 基本 成 立 。 反 观 淘宝 以 前 两 个 版 本 的 架构 ， 如 下 页 图 所 示 ， 你 
看 哪个 比较 美 ? 

显然 ， 第 一 个 比较 好 看 ， 第 二 个 显得 头 重 脚 轻 ， 这 也 注定 了 它 不 
是 一 个 稳定 的 版 本 ， 只 存活 了 不 到 半年 的 时 间 。2004 年 初 ，SQL Relay 
的 问题 解决 不 了 ， 数 据 库 必 须要 用 Oracle， 那 么 从 哪里 动 刀 呢 ? 只 有 换 
开发 语言 了 。 换 什么 语言 好 ? 用 Java。Java 是 当时 最 成 熟 的 网 站 开发 语 
言 ， 它 有 比较 良好 的 企业 开发 框架 ， 被 世界 上 主流 的 大 规模 网 站 普遍 
采用 。 另 外 ， 有 Java 开 发 经 验 的 人 才 也 比较 多 ， 后 续 维护 成 本 会 比较 
低 。 


脱胎 换 骨 的 升级 一 一 更 换 开发 语言 


到 2004 年 上 半年 ， 淘 宝 网 已 经 运行 了 一 年 的 时 间 ， 这 一 年 积累 了 
大 量 的 用 户 ， 也 快速 开发 了 很 多 功能 ， 当 时 这 个 网 站 已 经 很 庞大 了 ， 
而 且 新 的 需求 还 在 源源 不 断 地 增加 。 把 一 个 庞大 的 网 站 的 开发 语言 
挤 ， 无 异 于 脱胎 换 骨 ， 在 换 的 过 程 中 还 不 能 拖 慢 业务 的 发 展 ， 这 无 异 
于 边 换 边 跑 ， 对 时 间 和 技术 能 力 的 要 求 都 非常 高 。 做 这 样 的 手术 ， 需 
要 请 第 一 流 的 专家 来 主刀 。 现 在 再 考 一 下 
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大 家 : 杀 ， 如 果 你 在 这 个 创业 团队 中 ， 请 什么 样 的 人 来 做 这 件 
事 ? 我 们 的 答案 是 请 Sun 公 司 的 人 。 没 错 ， 就 是 创造 Java 语 言 的 那 家 公 
司 ， 世 界 上 没有 上 比 他 们 更 懂 Java 的 了 。 除 此 之 外 ， 还 有 一 个 不 为 人 知 的 
原因 ， 我 刚才 说 到 Java 被 世界 上 主流 的 大 规模 网 站 普遍 采用 ， 其 中 有 一 
个 网 站 就 是 eBay， 那 时 eBay 的 系统 刚刚 从 C++ 改 到 Java， 而 且 就 是 请 
Sun 的 工程 师 给 改造 成 Java 架 构 的 ， 这 下 你 懂 了 吧 ? 他 们 不 仅 更 懂 
Java， 而 且 更 懂 eBay。 

Sun 公 司 的 这 帮工 程 师 的 确 很 强大 ， 在 笔者 2004 年 年 底 来 淘宝 的 时 
候 ， 他 们 还 在 ， 我 有 笠 与 他 们 共事 了 几 个 月 。 现 在 摆 在 他 们 面前 的 问 
题 是 用 什么 办 法 把 一 个 庞大 的 网 站 从 PHP 语 言 迁 移 到 Java? 而 且 要 求 在 
迁移 的 过 程 中 ， 不 停止 服务 ， 原 来 系统 的 bugfix 和 功能 改进 不 受 影响 。 
亲 ， 你 要 是 架构 师 ， 你 怎么 做 ? 有 人 的 答案 是 写 一 个 翻译 器 ， 如 同 把 
中 文 翻译 成 英文 一 样 ， 自 动 翻 译 。 我 只 能 说 你 这 个 想法 太 超 前 了 ，“too 
young，too simple，sometimes naive”。 当时 没有 ， 现 在 也 没有 人 能 做 
到 。 他 们 的 大 致 方案 是 给 业务 分 模块 ， 一 个 模块 一 个 模块 地 渐进 式 蔡 
换 。 如 用 户 模块 ， 老 的 membertaobao.com 继 续 维护 ， 不 添加 新 功能 ， 
新 功能 在 新 的 模块 上 开发 ， 跟 老 的 模块 共用 一 个 数据 库 ， 开 发 完毕 之 
后 放 到 不 同 的 应 用 集群 上 ， 另 开 一 个 域名 member1l.taobao.com， 同 时 再 
蔡 换 老 的 功能 ， 蔡 换 一 个 ， 就 把 老 的 模块 上 的 功能 关闭 一 个 ， 逐 渐 把 
用 户 引 导 到 member1.taobao.com， 等 所 有 的 功能 都 替换 完 之 后 ， 关 闭 
member.taobao.com。 从 设计 上 来 看 ， 这 个 member1 的 二 级 域名 应 该 是 一 
个 过 渡 状 态 ， 但 我 们 把 member 域 名 的 代码 下 线 以 后 ， 发 现 很 难 把 
member1 切 换 回 member， 因 为 有 些 地 方 把 链接 写 死 了 ， 于 是 后 来 很 长 
时 间 里 我 们 都 是 在 用 memberl.taobao.com 这 样 奇怪 的 域名 。 一 年 后 ， 有 
另外 一 家 互联 网 公司 开始 做 电子 商务 了 ， 我 们 发 现 他 们 的 域名 也 叫 
member1.xx.com、 auction1.xx.com， 复 制 得 毫 无 保留 ， 我 们 只 能 会 心 一 
笑 。 

说 了 开发 模式 ， 再 说 说 用 到 的 Java MVC 框 架 ， 当 时 的 struts1.x 是 用 
得 比较 多 的 框架 ， 但 是 用 过 webwork 和 struts2 的 人 可 能 知道 ，struts1.x 在 
多 人 协作 方面 有 很 多 致命 的 弱点 ， 由 于 没有 一 个 轻 量 框架 作为 基础 ， 
因此 ， 很 难 扩展 ， 这 样 架构 师 对 于 基础 功能 和 全 局 功能 的 控制 就 很 难 
做 到 。 而 阿里 巴巴 的 18 个 创始 人 之 中 ， 有 个 架构 师 周 悦 虹 ， 他 在 Jakarta 
Turbine 的 基础 上 做 了 很 多 扩展 ， 打 造 了 一 个 阿里 巴巴 自己 用 的 MVC 框 


架 WebX (http: /www.openwebx.org/docs/Webx3_Guide_Book.html) ， 
这 个 框架 易于 扩展 ， 方 便 组 件 化 开发 ， 它 的 页 面 模板 支持 JSP 和 Velocity 
等 ， 持 久 层 支持 ibatis 和 hibernate 等， 控制 层 可 以 用 EJB 和 Spring 

(Spring 是 后 来 才 有 的 ) 。 项 目 组 选择 了 这 个 强大 的 框架 。 另 外 ， 当 时 
Sun 在 全 世界 大 力 推广 他 们 的 EJB， 虽 然 淘宝 的 架构 师 认为 这 个 东西 用 
不 到 ， 但 他 们 还 是 极力 坚持 。 在 经 历 了 很 多 次 的 技术 讨论 、 争 论 甚 至 
争吵 之 后 ， 这 个 系统 的 架构 就 变 成 了 下 图 的 形式 。 
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MVC 框 架 是 阿里 的 WebX， 控 制 层 用 了 EJB， 持 久 层 是 ibatis。 另 
外 ， 为 了 缓解 数据 库 的 压力 ， 商 品 查询 和 店铺 查询 放 在 搜索 引擎 中 。 
这 个 架构 图 是 不 是 好 看 了 一 点 了 ? 

Sun 的 这 帮工 程 师 开 发 完 淘宝 的 网 站 之 后 ， 用 同样 的 架构 又 做 了 一 
个 很 牛 的 网 站 ， 叫 “支付 宝 ”。 (上 一 篇 说 过 支付 宝 最 初 是 淘宝 上 的 “ 安 
全 交易 ”功能 ， 这 个 功能 后 来 独立 出 来 ， 成 立 了 一 个 网 站 ， 也 成 立 了 一 
个 公司 ， 就 是 现在 的 支付 宝 。 把 支付 宝 从 淘宝 分 出 去 的 人 ， 就 是 Sun 公 
司 的 这 几 个 人 。) 下 图 是 支付 宝 的 第 一 次 员工 大 会 。 


上 面 的 架构 中 ， 引 入 了 搜索 引擎 iSearch (前 文 说 过 ，iSearch 其 实 
是 在 LAMP 系 统 运行 一 段 时 间 之 后 被 多 隆 引 进 的 ， 换 为 Oracle 之 后 只 是 
替换 一 下 数据 源 ) 。 其 实 这 个 搜索 引擎 的 原理 很 简单 ， 就 是 把 数据 库 
里 的 数据 dump (倾倒 ) 成 结构 化 的 文本 文件 后 ， 放 在 硬盘 上 ， 提 供 
Web 应 用 以 约定 的 参数 和 语法 来 查询 这 些 数 据 。 这 看 起 来 不 难 ， 难 的 是 
数 以 亿 计 的 信息 ， 怎 么 做 到 快速 更 新 呢 ? 这 好 比 你 做 了 一 个 网 站 ， 在 
百度 上 很 快 就 能 搜 到 ， 你 一 定 很 满意 了 。 但 如 果 你 发 布 一 件 商品 ， 在 
淘宝 上 过 1 个 小 时 还 搜 不 到 ， 你 肯定 要 郁 六 了 。 另 一 个 难点 是 如 何 保证 
非常 高 的 容量 和 并 发 量 ? 表 往 后 面 就 要 考虑 断 句 和 语义 分 析 的 问题 ， 
以 及 推荐 算法 等 更 加 智能 的 问题 。 这 些 内 容 先 不 详细 介绍 ， 因 为 搜索 
引擎 的 技术 已 经 足以 写 好 几 本 书 了 。 

其 实在 任何 时 候 ， 开 发 语言 本 身 都 不 是 系统 的 瓶颈 ， 业 务 带 来 的 
压力 更 多 的 存在 于 数据 和 存储 方面 。 前 面 也 说 到 ，MySQL 撑 不 住 之 后 
换 为 Oracle，Oracle 的 存储 一 开始 在 本 机 上 ， 后 来 在 NAS 上 ，NAS 撑 不 
住 了 用 EMC 的 SAN 存 储 ， 再 后 来 ，Oracle 的 RAC 撑 不 住 了 ， 数 据 的 存 
储 方面 就 不 得 不 考虑 使 用 小 型 机 。 在 2004 年 夏天 ，DBA 七 公 、 测 试 工 
程 师 郭 关 和 架构 师 行 癫 ， 踏 上 了 去 北京 测试 小 型 机 的 道路 。 他 们 带 着 
小 型 机 回来 的 时 候 ， 我 们 像 欢 迎 领袖 一 样 欢 迎 他 们 ， 因 为 那 是 我 们 最 
值钱 的 设备 ， 价 格 表 上 的 数字 吓 死 人 。 小 型 机 买 回来 之 后 ， 我 们 争 相 


合影 ， 然 后 Oracle 就 运行 在 了 小 型 机 上 ， 存 储 方面 ， 从 EMC 低 端 CX 存 
储 到 Sun oem hds 高 端 存储 ， 再 到 EMC dmx 高 端 存储 ， 一 级 一 级 地 往 上 
跳 。 

到 2004 年 底 ， 淘 宝 网 已 经 有 4 百 多 万 种 商品 了 ， 日 均 4 千 多 万 个 
PV， 注 册 会 员 达 400 万 个 ， 全 网 成 交 额 达 10 亿 元 。 

到 现在 为 止 ， 我 们 已 经 用 上 了 IBM 的 小 型 机 、Oracle 的 数据 库 、 
EMC 的 存储 ， 这 些 东 西 都 是 很 贵 的 ， 那 些 年 可 以 说 是 花 钱 如 流水 。 有 
人 说 过 “ 钱 能 解决 的 问题 ， 就 不 是 问题 *， 但 随 着 淘宝 网 的 发 展 ， 在 不 
久 以 后 ， 钱 已 经 解决 不 了 我 们 的 问题 了 。 花 钱 买 豪华 的 配置 ， 也 许 能 
支持 1 亿 个 PV 的 网 站 ,但 淘宝 网 的 发 展 实在 是 太 快 了 ， 到 了 10 亿 个 PV 
怎么 办 ? 到 了 百 亿 怎么 办 ? 在 几 年 以 后 ， 我 们 不 得 不 创造 技术 ， 解 决 
这 些 只 有 世界 顶尖 的 网 站 才 会 遇 到 的 问题 。 后 来 我 们 在 开源 软件 的 基 
础 上 进行 自主 研发 ， 一 步 一 步 地 把 IOE (IBM 小 型 机 、Oracle、EMC 存 
储 ) 这 几 个 “神器 ”都 去 掉 了 。 这 些 神器 就 如 同 《 西 游记 》 中 那些 神仙 
的 兵器 ， 他 们 身边 的 妖怪 们 拿 到 这 些 兵 器 能 把 猴子 打 得 落荒 而 逃 。 但 
最 牛 的 神仙 是 不 依赖 这 些 神 器 的 ， 他 们 挥 一 挥 衣 袖 、 翻 一 下 手掌 就 威 
力 无 比 了 。 
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之 天 你 为 淘宝 做 了 什 入 ! 
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已 经 有 读者 在 迫不及待 地 问 怎 么 去 掉 了 IOE? 别 急 ， 在 去 掉 IOE 之 
前 还 有 很 长 的 路 要 走 (在 后 面 讲 到 TDDL 的 时 候 ， 会 提 到 去 IOE 的 一 些 
事情 ) 。 行 癫 等 人 买 回 小 型 机 之 后 ， 我 们 用 上 了 Oracle。 然 后 七 公 带 着 
一 帮 DBA 做 优化 SQL 和 存储 方面 的 工作 ， 行 癫 带 着 几 个 架构 师 研 究 数 
据 库 的 扩展 性 。Oracle 本 身 是 一 个 封闭 的 系统 ， 用 Oracle 怎 么 做 扩展 
呢 ? 用 现在 一 个 时 暑 的 说 法 就 是 做 “分 库 分 表 ”。 

我 们 知道 ， 一 台 Oracle 的 处 理 能 力 是 有 上 限 的 ， 它 的 连接 闻 有 数量 
限制 ， 查 询 速 度 与 容量 成 有 反比。 简单 地 说 ， 在 数据 量 上 亿 、 查 询 量 上 
亿 的 时 候 ， 就 到 它 的 极限 了 。 要 突破 这 种 极限 ， 最 简单 的 方式 就 是 多 
用 几 个 Oracle 数 据 库 。 但 一 个 封闭 的 系统 做 扩展 ， 不 像 分 布 式 系统 那样 
直接 加 机 器 就 可 以 了 。 我 们 的 做 法 是 把 用 户 的 信息 按照 ID 来 存放 到 两 
个 数据 库 中 (DB1 和 DB2) ， 把 商品 的 信息 和 卖家 信息 放 在 两 个 对 应 的 


数据 库 中 ， 把 商品 类 目 等 通用 信息 放 在 第 三 个 库 中 (DBcommon) 。 
这 么 做 的 目的 除了 增加 了 数据 库 的 容量 之 外 ， 还 有 一 个 就 是 做 容 灾 ， 
即 万 一 一 个 数据 库 挂 了 ， 整 个 网 站 上 还 有 一 半 的 商品 可 以 买 。 

数据 库 这 么 分 后 ， 应 用 程序 就 会 出 现 麻 烦 ， 如 果 我 是 卖家 ， 查 看 
我 的 商品 没有 问题 ， 我 们 都 在 一 个 库 里 。 但 如 果 我 是 一 个 买 家 ， 买 的 
商品 有 DB1 的 ， 也 有 DB2 的 ， 要 查看 “我 已 买 到 的 宝贝 ”的 时 候 ， 应 用 程 
序 怎么 办 ? 必须 到 两 个 数据 库 中 分 别 查询 对 应 的 商品 。 要 按时 间 排 序 
怎么 办 ? 两 个 库 中 “我 已 买 到 的 宝贝 * 全 部 查 出 来 在 应 用 程序 中 做 合 
并 。 另 外 ， 分 页 怎么 处 理 ? 关键 字 查 询 怎么 处 理 ? 专业 点 的 说 法 就 是 
数据 的 Join 没 法 做 了 。 这 些 工作 交 给 程序 员 来 做 也 许 会 更 麻烦 ， 于 是 行 
癫 出 手 了 ， 他 写 了 一 个 数据 库 路 由 的 框架 DBRoute， 统 一 处 理 了 数据 的 
人 合并、 排序、 分 页 等 操作 ， 让 程序 员 像 使 用 一 个 数据 库 一 样 操作 多 个 
数据 库 里 的 数据 ， 这 个 框架 在 淘宝 的 Oracle 时 代 一 直 在 使 用 。 但 是 后 来 
随 着 业务 的 发 展 ， 这 种 分 库 的 第 二 个 目的 -“ 容 灾 ” 的 效果 没有 达 
到 。 像 评价 、 投 诉 、 举 报 、 收 藏 、 我 的 淘宝 等 很 多 地 方 ， 都 必须 同时 
连接 DB1 和 DB2， 哪 个 库 挂 了 都 会 导致 整个 网 站 挂 掉 。 

前 面 说 过 ， 采 用 EJB 其 实 是 和 Sun 的 工程 师 受 协 的 结果 ， 在 他 们 离 
开 之 后 ，EJB 也 逐渐 被 冷落 了 下 来 。 在 2005 年 和 2006 年 的 时 候 ，Spring 
大 放 异 彩 ， 于 是 在 控制 层 用 Spring 替换 掉 了 EJB ， 给 整个 系统 精简 了 很 
多 代码 。 


商品 数 一 466 万 Yr 万 
几 一 401 万 。 GMv 成 交 全 额 -10 亿 


商品 数 一 1663 万 


GMV 成 交 全 额 一 80 


之 天 你 为 淘宝 做 了 什 人 2! 


前 面 还 说 过 ， 为 了 减少 数据 库 的 压力 ， 提 高 搜索 的 效率 ， 我 们 引 
入 了 搜索 引擎 。 随 着 数据 量 的 继续 增长 ， 到 了 2005 年 ， 商 品 数 有 1663 
万 个 ，PV 有 8931 万 个 ， 注 册 会 员 有 1390 万 个 ， 这 给 数据 存储 带 来 的 压 
力 依然 很 大 ， 数 据 量 大 ， 速 度 就 慢 。 杀 ， 除 了 搜索 引擎 、 分 库 分 表 ， 
还 有 什么 办 法 能 提升 系统 的 性 能 ? 一 定 还 有 招数 可 以 用 ， 这 就 是 缓存 
和 CDN (内 容 分 发 网 络 ) 。 

你 可 以 想象 ，9000 万 次 的 访问 量 ， 有 多 少 是 在 商品 详情 页 面 ? 访 
问 这 个 页 面 的 时 候 ， 数 据 全 都 是 只 读 的 〈 全 部 从 数据 库 中 读 出 来 ， 不 
写 入 数据 库 ) ， 在 那个 时 候 ， 我 们 的 架构 师 多 隆 大 神 做 了 一 个 基于 
Berkeley DB 的 缓存 系统 ， 把 很 多 不 太 变动 的 只 读 信息 放 了 进去 。 其 实 
最 初 这 个 缓存 系统 还 比较 弱 ， 我 们 并 不 敢 把 所 有 能 缓存 的 信息 都 往 里 
面 放 ， 一 开始 先 把 卖家 的 信息 放 里 面 ， 然 后 把 商品 属性 放 里 面 ， 再 把 
店铺 信息 放 里 面 ， 但 是 像 商 品 详情 这 类 字段 太 大 的 放 进 去 受 不 了 。 说 
到 商品 详情 ， 这 个 字段 比较 恐怖 ， 有 人 统计 过 ， 淘 宝 商 品 详情 打印 出 
来 平均 有 5 米 长 ， 在 系统 里 其 实 放 在 哪里 都 不 招 人 待 抑 。 笔 者 清楚 地 记 


得 ， 我 来 淘宝 之 后 担任 项 目 经 理 做 的 第 一 个 项 目 就 是 把 商品 详情 从 商 
品 表 中 移出 来 。 它 最 早 与 商品 的 价格 、 运 费 等 信息 放 在 一 个 表 中 ， 拖 
慢 了 整 张 表 的 查询 速度 ， 而 很 多 时 候 碍 询 商品 信息 是 不 需要 查看 详情 
的 。 于 是 在 2005 年 的 时 候 ， 我 把 商品 详情 放 在 数据 库 的 另外 一 张 表 
中 ， 再 往 后 ， 这 个 大 字段 被 从 数据 库 中 请 了 出 来 ， 先 是 放 入 了 缓存 系 
统 ， 到 现在 是 放 进 了 文件 系统 TFS 中 。 

到 现在 为 止 ， 整 个 商品 详情 的 页 面 都 在 缓存 里 面 了 ， 眼 尖 的 读者 
可 能 会 发 现 现 在 的 商品 详情 不 全 是 “只 读 ” 的 信息 了 ， 这 个 页 面 上 有 个 
信息 叫 “ 浏 览 量 ”( 这 个 信息 是 2006 年 加 上 去 的 ) ， 这 个 数字 每 刷新 一 
次 ， 页 面 就 要 “ 写 入 ”存储 一 次 ， 这 种 高 频 度 实时 更 新 的 数据 能 用 缓存 
吗 ? 通常 来 说 ， 这 种 是 必须 放 进 数据 库 的 ， 但 是 态 剧 的 是 ， 我 们 在 
2006 年 开发 这 个 功能 的 时 候 ， 把 浏览 量 写 入 数据 库 ， 发 布 上 线 1 个 小 时 
后 ， 数 据 库 就 挂 掉 了 ， 每 天 几 亿 次 的 写 入 ， 数 据 库 承受 不 了 。 那 怎么 
办 ? 杀 ，..………. 先 不 回答 你 ， 后 面 讲 到 缓存 Tair 的 时 候 再 说 。 (下 图 不 是 
广告 ， 请 把 注意 力 从 左边 移 到 右边 中 间 ， 看 看 浏览 量 这 个 数据 在 哪 
里 。) 
维多利亚 的 秘密 bikini 大 小 胸 聚 城 女 性 感 比基尼 欧美 外 贸 原 单 游泳 衣 
价 格 
sn: [EEF ¥ 148.00 
物流 运费 : ”上海 | 至 浙江 杭州 ~ 快递 : 半 0.00 EMS:¥ 22.00 
30 天 售 出 : 54 件 
评 。 价 : 妈妈 友 友 友 4.8 分 | 170 条 评价 
宝贝 类 型 : 全 新 | 22764 次 浏览 
支 ” 付 : 二 信 用 卡 分 期 货 到 付款 服务 : 加 
运动 服 尺码 “XS ( 欧 版 ， 参 考 描述 说 明 选 ) 


( 非 必 选 ) 
S〈 欧 版 ， 参 考 描述 说 明 选 ) 


M ( 欧 版 ， 参 考 描述 说 明 选 ) 


CDN 这 个 工作 相对 比较 独立 ， 跟 别 的 系统 一 样 ， 一 开始 我 们 采用 
的 也 是 商用 系统 。 后 来 随 着 流量 的 增加 ， 商 用 的 系统 已 经 撑 不 住 了 ， 
LVS 的 创始 人 章 文 高 博士 带 人 搭建 了 淘宝 自己 的 CDN 网 络 。 在 本 文 的 
引言 中 ， 我 说 过 淘宝 的 CDN 系 统 支撑 了 800Gbps 以 上 的 流量 ， 作 为 对 
比 ， 我 们 可 以 看 一 下 国内 专业 做 CDN 的 上 市 公司 ChinaCache 的 介绍 


“ChinaCache 是 中 国 第 一 的 专业 CDN 服 务 提供 商 ， 向 客户 提供 全 方 
位 网 络 内 容 快速 分 布 解决 方案 。 作 为 首 家 获 信 产 部 许可 的 CDN 服 务 提 
供 商 ， 目 前 ChinaCache 在 全 国 50 多 个 大 中 城市 拥有 近 300 个 节点 ， 全 网 
处 理 能 力 超过 500Gbps， 其 CDN 网 络 覆 盖 中 国电 信 、 中 国 网 通 、 中 国 移 
动 、 中 国联 通 、 中 国 铁通 和 中 国教 育 科 研 网 等 各 大 运营 商 。” 淘宝 
一 家 的 流量 比 他 们 的 加 起 来 还 要 多 ， 这 样 你 可 以 看 出 淘宝 在 CDN 上 的 
实力 ， 这 在 全 世界 都 是 数一数二 的 (其实 我 们 一 开始 用 的 商用 CDN 就 
是 ChinaCache， 它 们 支撑 了 很 长 时 间 ) 。 另 外 ， 因 为 CDN 需 要 大 量 的 
服务 器 ， 要 消耗 很 多 能 源 (消耗 多 少 ? 在 前 两 年 我 们 算 过 一 笔 账 ， 淘 


的 团队 又 在 研究 低 功 耗 的 服务 器 ， 在 绿色 计算 领域 也 做 了 很 多 开创 性 
的 工作 ， 我 们 定制 的 基于 英特尔 凌 动 处 理 器 的 低 功 耗 服务 器 已 经 部 署 
到 了 CDN 机 房 ， 降 低 了 很 大 的 能 耗 。 这 方面 的 内 容 可 以 看 后 面 笔者 对 
章 文 渍 博士 的 专访 。 

回想 起 刚 用 缓存 那 段 时 间 ， 笔 者 还 是 个 菜鸟 ， 有 一 个 经 典 的 错误 
常常 犯 ， 就 是 更 新 数据 库 的 内 容 时 ， 筷 记 通 知 缓存 系统 ， 结 果 在 测试 
的 时 候 就 发 现 我 改过 的 数据 在 页 面 上 没有 变化 。 后 来 做 了 一 些 页 面 上 
的 代码 ， 修 改 CSS 和 JS 的 时 候 ， 用 户 本 地 缓存 的 信息 没有 更 新 ， 页 面 上 
也 会 乱 掉 ， 在 论坛 上 被 人 说 的 时 候 ， 我 告诉 他 用 Ctrl+F5 组 合 键 (清除 
本 地 缓存 刷新 页 面 ) ， 然 后 赶紧 修改 脚本 文件 的 名 称 ， 重 新 发 布 页 
面 。 

我 们 对 数据 分 库 、 放 弃 EJB、5 引 入 Spring、 加 入 缓存 、 加 入 CDN 等 
工作 ， 看 起 来 没有 章法 可 循 ， 其 实 都 是 围绕 着 提高 容量 、 提 高 性 能 、 
节约 成 本 来 做 的 ， 由 于 这 些 是 不 算 大 的 版 本 变迁 ， 我 们 姑且 叫 它 2.1 
版 ， 这 个 版 本 从 构图 上 看 有 三 只 脚 ， 是 不 是 稳定 了 很 多 ? 


JBoss 
渔 宝 MVC 
Spring 
OR-Mapping 


[are [= Node 


在 这 个 稳定 的 版 本 下 ， 淘 宝 网 的 业务 有 了 突飞猛进 的 发 展 ，2005 
年 5 月 ， 微 软 的 MSN 门户 大 张 旗 鼓 地 进入 中 国 ， 淘 宝 网 成 为 它 的 购物 频 
道 。2005 年 中 ， 盛 大 进军 机 顶 盒 业务 ， 其 电视 购物 的 功能 也 是 淘宝 网 
开发 的 。 虽 然 因 为 水 土 不 服 或 者 政策 的 原因 ， 这 两 个 业务 现在 都 看 不 
到 了 ， 但 他 们 曾经 是 中 国 互联 网 行业 的 大 事件 。 那 位 和 微软 谈 合 作 的 
人 是 @ 胖 胡 斐 ， 他 花 起 钱 来 也 是 大 手笔 的 ， 我 们 就 管 他 叫 “ 二 少爷 ”， 他 
现在 是 蘑 妆 街 的 COO。 

另外 ， 老 马 也 从 来 都 不 缺少 娱乐 精神 ， 他 看 到 湖南 卫视 的 超女 如 
此 成 功 ， 也 想 借 鉴 一 下 这 种 模式 。 就 在 2005 年 底 ， 淘 宝 网 和 湖南 卫视 
合作 推出 了 一 档 节 目 ， 叫 做 “超级 Buyer 秀 ”。 这 是 一 个 定位 于 “超级 会 网 
购 的 人 ”的 一 个 选秀 节目 ， 以 百 万 年 薪 为 诱 乌 ， 让 大 家 分 享 自己 的 网 购 
经 历 ， 网 友 投 票选 出 最 终 胜 者 。 这 个 从 海 选 到 表演 ， 历 时 一 年 多 ， 广 
告 做 得 铺天盖地 。 虽 然 节目 最 终 没 有 超女 那样 火爆 ， 这 也 让 “淘宝 网 就 
是 网 购 ” 的 形象 通过 湖南 卫视 更 加 深入 人 心 。 


个 


9 月 15 日 - 10 月 15 日 国 10 月 16 日 -11 月 15 日 11 月 16 日 - 12 月 31 日 


成 功 晋 级 的 20 人 进行 


到 2006 年 ， 淘宝 网 已 经 有 了 1.5 亿 个 的 日 均 PV， 商品 数 达 5 千 多 万 
注册 用 户 3 千 多 万 个 ， 全 网 成 交 额 达 169 亿 元 。 


第 4 章 创造 技术 


用 钱 能 解决 的 问题 都 不 是 问题 ， 我 们 花 钱 可 以 购买 更 好 的 机 器 和 
更 好 的 服务 。 但 当 你 变 成 业内 最 强 之 后 ， 你 的 问题 就 会 独特 到 没有 人 
碰 到 过 ， 这 就 意味 着 你 必须 自己 动手 解决 问题 。 幸 运 的 是 ， 淘 宝 网 的 
发 展 很 快 ， 不 幸 的 是 ， 淘 宝 网 遇 到 了 前 所 未 有 的 问题 。 于 是 ， 淘 宝 网 
被 迫 开 始 走向 了 技术 创新 的 道路 。 而 技术 的 创新 和 业务 的 创新 到 底 又 
是 谁 推动 了 谁 ? 

淘宝 文件 系统 一 一 TFS 

淘宝 KV 缓存 系统 一 一 Tair 

回顾 一 下 上 面 几 个 版 本 ，1.0 版 的 PHP 系 统 运行 了 将 近 一 年 的 时 间 

(2003 年 5 月 一 2004 年 1 月 ) ， 服 务 器 由 一 台 发 展 到 多 台 ; 后 来 数据 库 
撑 不 住 了 ， 将 MySQL 换 成 了 Oracle， 引 入 了 搜索 引擎 (2004 年 1 月 一 
2004 年 5 月 ， 叫 1.1 版 本 ) ; 然后 不 到 半年 的 时 间 又 把 开发 语言 换 成 了 
Java (2004 年 2 月 一 2005 年 3 月 ， 叫 2.0 版 本 ) ， 数 据 服 务 逐 步 采 用 了 
IOE; 随 着 数据 量 和 访问 量 的 增长 ， 我 们 进行 数据 分 库 、 加 入 缓存 、 使 
用 CDN 《2004 年 10 月 一 2007 年 1 月 ， 叫 2.1 版 本 ) 。 这 几 个 版 本 中 间 有 些 
时 间 上 的 重合 ， 因 为 很 多 架构 的 演化 并 没有 明显 的 时 间 点 ， 它 是 逐步 
进化 而 来 的 。 

在 描述 2.1 版 本 的 时 候 ， 我 写 的 标题 是 《 坚 若 痪 石 》， 这 个 “ 坚 若 磐 
石 ”是 因为 这 个 版 本 终于 稳定 下 来 了 ， 在 这 个 版 本 的 系统 上 ， 淘 宝 网 运 
行 了 两 年 多 的 时 间 。 这 期 间 有 很 多 优秀 的 人 才 加 入 ， 也 开发 了 很 多 优 
秀 的 产品 ， 例 如 ， 商 品 的 类 目 属 性 、 支 付 宝 认 证 系统 、 招 财 进 宝 项 
目 、 淘 宝 旅 行 、 淘 宝 彩 票 、 淘 宝 论坛 等 ， 甚 至 在 团购 网 站 风起云涌 之 
前 ， 淘 宝 网 在 2006 年 就 推出 了 “团购 ”的 功能 。 

在 这 些 产 品 和 功能 的 最 底层 ， 其 实 还 是 商品 管理 和 交易 管理 这 两 
大 功能 。 这 两 大 功能 在 2.1 版 本 中 都 有 很 大 的 变化 。 商 品 管理 起 初 是 要 
求 卖家 选择 7 天 到 期 还 是 14 天 到 期 ， 到 期 之 后 自动 下 架 ， 必 须 重 新 发 布 
才能 上 架 ， 上 架 之 后 就 变 成 了 新 的 商品 信息 (ID 变 过 了 ) 。 另 外 ， 如 
果 商 品 在 这 期 间 成 交 了 ， 之 后 再 有 新 货 ， 必 须发 布 一 个 新 的 商品 信 


息 。 这 么 做 有 几 个 原因 ， 一 是 参照 拍卖 商品 的 时 间 设 置 ， 要 在 某 日 期 
前 结束 挂牌 ;二 是 搜索 引擎 不 知道 同样 的 商品 哪个 排 在 前 面 ， 那 融 把 
挂牌 时 间 长 的 排 前 面 (这 样 就 必须 在 某 个 时 间 把 老 的 商品 下 架 ， 否 则 
它 会 一 直 排 在 前 面 ) ; 第 三 是 成 交 信息 和 商品 ID 关联 ， 这 个 商品 如 果 
多 次 编辑 还 是 同一 个 ID 的 话 ， 成 交 记 录 中 的 丙 品 信息 会 不 断 改变 ， 还 
有 一 个 不 为 人 知 的 原因 是 我 们 的 存储 有 限 ， 不 能 让 所 有 的 商品 老 存 放 
在 主 库 中 。 这 种 处 理 方式 简单 粗暴 ， 但 还 算是 公平 。 不 过 这 样 会 导 至 
很 多 需求 都 无 法 满足 ， 例 如 ， 卖 出 一 件 商品 之 后 就 无 法 更 改 价格 ， 否 
则 前 面 已 经 成 交 的 那个 价格 都 变 了 ， 而 且 同样 的 商品 ， 上 一 次 销售 后 
的 很 多 好 评 都 无 法 在 下 一 个 商品 上 体现 出 来 ) 再 如 ， 我 买 过 的 商品 结 
束 后 只 看 到 交易 的 信息 ， 不 知道 卖家 是 否 还 会 卖 。 基 于 这 些 需 求 ， 我 
们 在 2006 年 下 半年 把 商品 和 交易 拆 开 ， 一 个 商家 的 一 种 商品 有 一 个 唯 
一 的 ID， 上 下 架 都 是 同一 个 商品 。 那 么 如 果 卖 家 修改 价格 和 库存 等 信 
息 ， 已 成 交 的 信息 怎么 处 理 ? 那 就 在 买 家 每 交易 一 次 的 时 候 ， 都 记录 
下 商品 的 快照 信息 ， 有 多 少 次 交易 就 有 多 少 个 快照 。 这 样 买 卖 双 方 比 
较 爽 了 ， 但 这 给 系统 带 来 了 什么 ? 存储 的 成 本 大 幅度 上 升 了 ! 
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存储 的 成 本 高 到 什么 程度 呢 ? 数据 库 方面 用 了 IOE， 一 套 下 来 就 是 
千 万 级 别 的 ， 那 几 套 下 来 就 是 一 一 好 多 钱 啊 。 另 外 ,淘宝 网 还 有 很 多 
文件 需要 存储 ， 最 主要 的 就 是 图 片 、 商 品 描述 、 交 易 快照 ， 一 个 商品 
要 包含 几 张 图 片 和 一 长 串 的 描述 信息 ， 而 每 一 张 图 片 都 要 生成 几 张 规 
格 不 同 的 缩 略 图 。 在 2010 年 ， 淘 军 网 的 后 端 系统 上 保存 着 286 亿 个 图 片 
文件 。 图 片 在 交易 系统 中 非常 重要 ， 大 家 党 说 “一 张 好 图 胜 千 言 "“ 无 
图 无 真相 ”， 淘 宝 网 的 商品 照片 ， 尤 其 是 热门 商品 图 片 的 访问 流量 是 非 
单 大 的 。 在 淘宝 网 整体 流量 中 ， 图 片 的 访问 流量 要 占 到 90% 以 上 ， 而 且 
这 些 图 片 平均 大 小 为 17.45KB， 小 于 8KB 的 图 片 占 整体 图 片 数 量 的 
61%， 占 整体 系统 容量 的 11%。 这 么 多 的 图 片 数 据 、 这 么 大 的 访问 流 
量 ， 给 淘宝 网 的 系统 带 来 了 巨大 的 挑战 。 对 于 大 多 数 系统 来 说 ， 最 头 
疼 的 就 是 大 规模 的 小 文件 存储 与 读 取 ， 因 为 磁头 需要 频繁 寻 道 和 换 
道 ， 因 此 ， 在 读 取 上 容易 带 来 较 长 的 延 时 。 在 大 量 高 并 发 访问 量 的 情 
况 下 ， 简 直 就 是 系统 的 避 梦 。 我 们 该 怎么 办 ? 


同样 的 套路 ， 在 某 个 规模 以 下 采用 现 有 的 商业 解决 方案 ， 达 到 某 
种 规模 之 后 ， 丙 业 的 解决 方案 无 法 满足 ， 只 有 自己 创造 解决 方案 了 。 
对 于 淘宝 的 图 片 存 储 来 说 ， 转 折 上 点 在 2007 年 。 这 之 前 ， 一 直 采 用 商用 
存储 系统 ， 应 用 NetApp 公 司 的 文件 存储 系统 。 随 着 淘宝 网 的 图 片 文件 
效 量 以 每 年 3 倍 的 速度 增长 ， 淘 宝 网 后 端 NetApp 公 司 的 存储 系统 也 从 低 
端 到 高 端 不 断 迁 移 ， 直 至 2006 年 ， 即 使 是 NetApp 公 司 最 高 端的 产品 也 
不 能 满足 淘宝 网 存储 的 要 求 。 从 2006 年 开始 ， 我 们 决定 自己 开发 一 套 
针对 海量 小 文件 存储 的 文件 系统 ， 用 于 解决 自身 图 片 存 储 的 难题 。 这 
标志 着 淘宝 网 从 使 用 技术 到 了 创造 技术 的 阶段 。 


2007 年 之 前 的 图 片 存 储 架 构 如 下 图 所 示 。 
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在 一 次 架构 师 大 会 上 ， 章 文 高 博士 总 结 了 几 点 商用 存储 系统 的 局 
限 和 不 足 。 


第 一 ， 商 用 存储 系统 没有 对 小 文件 存储 和 读 取 的 环境 进行 有 针对 
性 的 优化 ; 第 二 ， 文 件数 量 大 ， 网 络 存储 设备 无 法 支撑 ; 第 三 ， 整 个 
系统 所 连接 的 服务 器 越 来 越 多 ， 网 络 连 接 数 已 经 达到 网 络 存储 设备 的 
极限 ; 第 四 ， 商 用 存储 系统 扩容 成 本 高 ，10TB 的 存储 容量 需要 几 百 万 
元 ， 而 且 存 在 单 点 故障 ， 容 灾 和 安全 性 无 法 得 到 很 好 的 保证 。 


谈 到 在 商用 系统 和 自主 研发 之 间 的 经 济 效益 方面 的 对 比 ， 章 文 高 
博士 列举 了 以 下 几 点 经 验 。 

第 一 ， 商 用 软件 很 难 满足 大 规模 系统 的 应 用 需求 ， 无 论 是 存储 、 
CDN 还 是 负载 均衡 ， 在 厂商 实验 室 端 ， 都 很 难 实现 如 此 大 的 数据 规模 
测试 。 

第 二 ， 在 研发 过 程 中 ， 将 开源 和 上 自主 开发 相 结合 ， 会 有 更 好 的 可 
控 性 ， 若 系统 出 了 问题 ， 完 全 可 以 从 底层 解决 问题 ， 系 统 扩展 性 也 更 
[BJ]o 

第 三 ， 在 一 定 规模 效应 的 基础 上 ， 研 发 的 投入 都 是 值得 的 。 下 图 
演示 的 是 一 个 自主 研发 和 购买 商用 系统 的 投入 产 出 比 ， 实 际 上 ， 图 中 
交叉 点 的 左边 ， 购 买 商用 系统 都 是 更 加 实际 和 经 济 性 更 好 的 选择 ， 只 
有 在 规模 超过 交叉 点 的 情况 下 ， 自 主 研 发 才能 收 到 较 好 的 经 济 效果 。 
实际 上 ， 规 模 化 达到 如 此 程度 的 公司 并 不 多 ， 不 过 淘宝 网 已 经 远 远 起 
过 了 交叉 后 。 
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第 四 ， 自 主 研 发 的 系统 可 在 软件 和 硬件 的 多 个 层次 之 间 不 断 优 
化 。 

历史 总 是 惊人 的 巧合 ， 在 我 们 准备 研发 文件 存储 系统 的 时 候 ， 
Google 走 在 了 前 面 ，2007 年 ， 他 们 公布 了 GFS (Google File System) 的 
设计 论文 ， 这 给 我 们 带 来 了 很 多 借鉴 的 思路 。 随 后 我 们 开发 出 了 适合 
淘宝 使 用 的 图 片 存 储 系 统 (TaoBao File System，TFS) 。3 年 之 后 ， 我 
们 发 现 历史 的 巧合 比 我 们 想象 的 还 要 神奇 ， 几 乎 跟 我 们 同时 ， 中 国 的 


另外 一 家 互联 网 公司 也 开发 了 他 们 的 文件 存储 系统 ， 甚 至 取 的 名 字 都 
一 样 一 一 TFS， 太 神奇 了 ! ( 猿 猜 是 哪 家 ) 

2007 年 6 月 ，TFS 正 式 上 线 运营 。 在 生产 环境 中 应 用 的 集群 规模 达 
到 了 200 台 PC Server (146GBx6 SAS 15KB Raid5) ， 文 件数 量 达 到 上 
亿 级 别 ; 系统 部 署 存储 容量 为 140TB; 实际 使 用 存储 容量 为 50TB; 单 
台 支 持 随机 IOPS 200+， 流 量 为 3MB/s。 

说 到 TFS 的 系统 架构 ， 首 先 要 描述 清楚 业务 需求 ， 淘 宝 对 图 片 存储 
的 需求 大 概 可 以 描述 如 下 : 

文件 比较 小 ; 并 发 量 高 ， 读 操作 远大 于 写 操 作 ; 访问 随机 ; 没有 
文件 修改 的 操作 ; 要 求 存 储 成 本 低 ; 能 容 灾 ， 能 备份 。 显 然 ， 应 对 这 
种 需求 时 要 用 分 布 式 存储 系统 ; 由 于 文件 大 小 比较 统一 ， 可 以 采用 专 
有 文件 系统 ; 由 于 并 发 量 高 ， 读 写 随机 性 强 ， 需 要 更 少 的 MO 操作 ; 考 
虑 到 成 本 和 备份 ， 需 要 用 廉价 的 存储 设备 ; 考虑 到 容 灾 ， 需 要 能 平滑 
扩容 。 

参照 GFS 并 做 了 大 量 的 优化 之 后 ，TFS 1.0 版 的 架构 图 如 下 。 
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从 上 面 的 架构 图 可 看 出 : 集群 由 一 对 Name Server 和 多 人 台 Data 
Server 构 成 ，Name Server 的 两 台 服 务 器 互 为 双 机 ， 这 就 是 集群 文件 系统 


ControlMessage 


中 管理 节点 的 概念 。 

在 这 个 系统 中 : 

e 每 个 Data Server 运 行 在 一 台 普 通 的 Linux 主 机 上 ， 

e 以 Block 文 件 的 形式 存放 数据 文件 (一 个 Block 的 大 小 一 般 为 
64MB) ; 

eBlock 存 储 多 份 是 为 了 保证 数据 安全 ，; 

e 利 用 ext3 文 件 系 统 存放 数据 文件 ; 

e 似 盘 raid5 做 数据 元 余 ; 

e 文 件 名 内 置 元 数据 信息 ， 用 户 自己 保存 TFS 文 件 名 与 实际 文件 的 
对 照 关 系 ， 这 使 得 元 数据 量 特别 小 。 

淘宝 TFS 文 件 系统 在 核心 设计 上 最 大 的 取 巧 在 于 ， 传 统 的 集群 系统 
中 元 数据 只 有 1 份 ， 通 常 由 管理 节点 来 管理 ， 因 而 很 容易 成 为 狐 颈 。 而 
对 于 淘宝 网 的 用 户 来 说 ， 图 片 文件 究竟 用 什么 名 字 来 保存 他 们 并 不 关 
心 ， 因 此 ，TFS 在 设计 规划 上 考虑 在 图 片 的 保存 文件 名 上 暗 茂 了 一 些 元 
数据 信息 ， 例 如 ， 图 片 的 大 小 、 时 间 、 访 问 频次 等 信息 ， 包 括 所 在 的 
逻辑 块 号 。 而 在 实际 的 元 数据 上 ， 保 存 的 信息 很 少 ， 因 此 ， 元 数据 结 
构 非常 简单 。 仅 仅 只 需要 一 个 FileID 就 能 够 准确 定位 文件 在 什么 地 方 。 
由 于 大 量 的 文件 信息 都 隐藏 在 文件 名 中 ， 整 个 系统 完全 抛 奔 了 传统 的 
目录 树 结构 ， 因 为 目录 树 开 销 最 大 。 拿 掉 后 ， 整 个 集群 的 高 可 扩展 性 
可 极 大 地 提高 。 实 际 上 ， 这 一 设计 理念 和 目前 业界 的 “对 象 存储 ” 较 类 
似 。 

在 TFS 上 线 之 前 ， 淘 宝 网 每 个 商品 只 允许 上 传 一 张 图 片 ， 大 小 限定 
在 120KB 之 内 ， 在 商品 详情 中 的 图 片 必 须 使 用 外 站 的 服务 。 那 时 候 发 
布 一 件 商品 确实 非常 麻烦 ， 笔 者 曾经 想 卖 一 台 二 手电 脑 ， 我 先 把 照片 
上 传 到 Google 相 册 ， 在 发 布 到 淘宝 网 之 后 发 现 Google 相 册 被 墙 〈 即 被 
屏 撒 ， 无 法 访问 ) ， 我 的 图 片 别 人 看 不 到 ， 当 时 很 郁闷。 在 TFS 上 线 
后 ， 商 品 展 示 图 片 开 放 到 5 张 ， 商 品 描述 里 面 的 图 片 也 可 以 使 用 淘宝 的 
图 片 服 务 ， 到 现在 为 止 ， 淘 宝 网 给 每 个 用 户 提 供 了 1GB 的 图 片 空间 。 
技术 和 业务 就 是 这 么 互相 借 力 推动 着 的 ， 业 务 满足 不 了 的 时 候 ， 技 术 
必须 创新 ， 技 术 创新 之 后 ， 业 务 有 了 更 大 的 发 展 空间 。 
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TFS 发 布 之 后 ， 又 经 历 了 多 个 版 本 的 修改 ， 到 1.3 版 的 时 候 已 经 比 


较 成 熟 了 。2009 年 6 月 ， 1.3 版 本 上 线 ， 集 群 规模 大 大 扩展 ， 


淘宝 的 图 片 生 产 系 统 上 ， 整 个 系统 已 经 从 原 有 200 台 PC 服务 器 扩 增 至 
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440 台 PC 服务 器 (300Bx12 SAS 15KB RPM ) +30 台 PC 服务 器 
(600Bx12 SAS 15KB RPM) 。 支 持 文件 数量 也 扩容 至 百 亿 级 别 ; 系统 
部 署 存 储 容量 为 1800TB; 当前 实际 存储 容量 为 995TB; 单 台 DataServer 


支持 随机 IOPS900+， 流 量 为 15MB+; 
是 217MB (服务 器 使 用 千 焰 网 卡 ) 。 


目前 NameServer 运 行 的 物理 内 存 


TFS 1.3 版 本 逻辑 结构 图 如 下 图 所 示 。 
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在 TFS 1.3 版 本 中 ， 工 程 师 们 重点 改善 了 心跳 和 同步 的 性 能 ， 最 新 
版 本 的 心跳 和 同步 在 几 秒 钟 之 内 就 可 完成 切换 ， 同 时 进行 了 一 些 新 的 
优化 ， 包 括 元 数据 存储 在 内 存 中 、 清 理 磁 盘 空间 等 。 

性 能 上 也 做 了 优化 ， 包 括 如 下 内 容 。 

e 采 用 ext4 文 件 系 统 ， 并 且 预 分 配 文件 ， 减 少 ext3 等 文件 系统 数据 
碎片 带 来 的 性 能 损耗 ; 

e 单 进程 管理 单 块 磁盘 的 方式 ， 据 除 RAID5 机 制 |; 

e 带 有 HA 机 制 的 中 央 控 制 节 点 ， 在 安全 稳定 和 性 能 复杂 度 之 间 取 
得 平衡 ; 

e 缩 减 元 数据 大 小 ， 将 更 多 的 元 数据 加 载 入 内 存 ， 提 升 访问 速度 ; 

e 跨 机 架 和 IDC 的 负载 均衡 及 宛 余 安全 策略 ; 

e 完 全 平滑 扩容 。 

对 于 整个 图 片 服 务 来 说 ， 仅 有 TEFS 还 是 不 够 的 ， 整 个 图 片 服 务 机 器 
的 拓扑 结构 如 下 图 所 示 。 
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整个 图 片 存储 系统 就 像 一 个 庞大 的 服务 器 ， 有 处 理 单元 、 缓 存单 
元 和 存储 单元 。 前 面 已 经 介绍 过 后 台 的 TFS 集 群 文件 存储 系统 ， 在 TFS 
前 端 ， 还 部 署 着 200 多 人 台 图 片 文 件 服务 器 ， 用 Apache 实 现 ， 用 于 生成 缩 
略图 的 运算 。 

值得 一 提 的 是 ， 根 据 淘 宝 网 的 缩 略图 生成 规则 ， 缩 略图 都 是 实时 
生成 的 。 这 样 做 的 好 处 有 两 点 : 一 是 为 了 避免 后 端 图 片 服 务 器 上 存储 
的 图 片 数 量 过 多 ， 大 大 节约 后 台 存 储 空间 的 需求 ， 我 们 计算 过 ， 采 用 
实时 生成 缩 略 图 的 模式 比 提前 全 部 生成 好 缩 略图 的 模式 节约 90% 的 存储 
空间 。 也 就 是 说 ， 存 储 空间 只 需要 后 一 种 模式 的 10%。 二 是 ， 缩 略图 可 
根据 需要 实时 生成 ， 这 样 更 加 灵活 。 

图 片 文件 服务 器 的 前 端 则 是 一 级 缓存 和 二 级 缓存 ， 前 面 还 有 全 局 


定 存 在 ， 重 要 的 是 ， 计 图 片 尽量 在 缓存 中 命中 。 目 前 淘宝 网 在 各 个 运 
营 商 的 中 心 点 设 有 二 级 缓存 ， 整 体系 统 中 心 店 设 有 一 级 缓存 ， 加 上 全 
局 负载 均衡 ， 传 递 到 后 端 TFS 的 流量 就 已 经 非常 均衡 和 分 散 了 ， 对 前 端 
的 响应 性 能 也 大 大 提高 。 根 据 淘 宝 的 缓存 策略 ， 大 部 分 图 片 都 尽量 在 
缓存 中 命中 ， 如 果 缓 存 中 无 法 命中 ， 则 会 在 本 地 服务 器 上 查找 是 否 存 
有 原 图 ， 并 根据 原 图 生成 缩 略 图 ， 如 果 都 没有 命中 ， 则 会 考虑 去 后 人 台 


TEFS 集群 文件 存储 系统 上 调 取 。 因 此 ， 最 终 反 馈 到 TFS 集 群 文件 存储 系 
统 上 的 流量 已 经 被 大 大 优化 了 。 

淘宝 网 将 图 片 处 理 与 缓存 编 写成 基于 Nginx 的 模块 ， 我 们 认为 ， 
Nginx 是 目前 性 能 最 高 的 HITP 服 务 器 ， 代 码 清晰 ， 模 块 化 非常 好 。 淘 
宝 网 使 用 GraphicsMagick 进 行 图 片 处 理 ， 采 用 了 面向 小 对 象 的 缓存 文件 
系统 ， 前 端 有 LVS+Haproxy 将 原 图 和 其 所 有 的 绾 略图 请 求 都 调度 到 同一 
台 Image Server (图 片 服 务 器 ) 。 

在 文件 定位 上 上， 内存 用 Hash 算 法 做 索引 ， 最 多 一 次 读 盘 。 另 外 会 
有 很 多 相同 的 图 片 重 复 上 传 上 来 ， 去 除 重 复 文 件 也 是 采用 Hash 算 法 来 
做 的 。 写 盘 方 式 则 采用 Append 方 式 写 ， 并 采用 了 淘汰 策略 FIFO， 主 要 
考虑 降低 硬盘 的 写 操 作 ， 没 有 必要 进一步 提高 Cache 命 中 率 ， 因 为 
ImageServer 和 TFS 位 于 同一 个 数据 中 心 ， 读 盘 效 率 还 是 非常 高 的 。 

目前 淘宝 网 的 TFS 已 经 开源 ( 见 code.taobao.org) ， 业 界 的 同仁 可 
以 一 起 使 用 和 完善 这 个 系统 。 


淘宝 KV 缓存 系统 


TEFS 的 开发 让 淘宝 的 图 片 功能 得 到 了 充分 的 发 挥 。 同 TFS 一 样 ， 很 
多 技术 都 是 在 产品 的 推动 下 得 到 发 展 的 。 在 介绍 下 面 的 技术 之 前 ， 有 
必要 说 说 前 些 年 我 们 做 过 的 几 个 产品 。 

先 说 一 个 比较 悲剧 的 一 一 “团购 ”， 这 个 团购 可 不 是 现在 满 大 街 挂 
的 那 种 Groupon 类 型 的 模式 ， 在 Groupon 产 生 之 前 ， 在 2006 年 ， 淘 宝 的 
产品 经 理 一 灯 就 提出 了 “团购 ”这 种 产品 。 一 灯 最 初 的 设想 是 让 买 家 在 
社区 发 起 团购 ，“ 团 长 ”找到 足够 的 人 之 后 ， 去 跟 卖 家 砍 价 ， 这 类 似 于 
现在 蘑菇 街 的 * 自 由 团 ”。 但 由 于 种 种 原因 ， 在 开发 的 时 候 ， 对 产品 的 
功能 做 了 裁剪 ,与 最 初 的 设想 比 起 来 偏离 了 一 点 ， 变 成 了 让 卖家 设置 
团购 价 ， 在 买 家 达到 指定 的 数量 之 后 ， 以 团购 价 成 交 。 这 个 功能 看 起 
来 是 结合 了 淘宝 “一 口 价 ” 和 “荷兰 拍 ” 的 另 一 种 交易 模式 ， 但 最 终 没 有 支 
撑 下 去 ， 这 种 交易 方式 最 大 的 弱点 就 是 让 买 家 看 到 了 卖家 的 底牌 ， 即 
便 达 不 到 团购 的 数量 ， 他 们 也 往 团 购 的 价格 上 砍 。 当 时 为 了 提高 流 
量 ， 淘 宝 网 开辟 了 团购 专区 ， 实 诚 的 卖家 在 达 不 到 团购 数量 的 时 候 ， 
被 砍 价 砍 亏 了 ， 狼 独 的 卖家 干脆 提高 原价 ， 利 用 这 个 专区 做 促销 。 在 


Tair 


接 下 来 的 两 年 里 ， 这 个 产品 沦落 成 了 促销 工具 〈 话 说 现在 满 大 街 的 团 
购 ， 其 实 也 就 是 促销 ) 。 这 个 产品 让 研发 人 员 对 “产品 ”这 个 概念 有 了 
深刻 的 认识 。 

再 说 一 个 更 加 悲剧 的 一 一 “我 的 淘宝 ”。“ 我 的 淘宝 ”是 给 会 员 管理 自 
己 的 商品 、 交 易 、 收 货 地 址 、 评 价 、 投 诉 的 地 方 ， 这 个 地 方 必须 在 登 
录 之 后 才能 看 到 ， 所 以 风格 与 外 观 完全 不 一 样 ， 很 长 时 间 都 没有 优化 
过 ， 样 子 丑 ， 用 户 操 作 也 不 方便 ， 如 果 一 个 人 有 很 多 商品 ， 上 下 染 需 
要 一 个 一 个 地 操作 ， 非 常 麻烦 ( 想 想 那 些 卖 书 的 ) 。 这 时 候 一 个 重要 
人 物 承 志 〈 现 在 的 蘑菇 街 CEO) 登场 了 ， 他 给 我 们 演示 了 最 牛 的 前 端 
交互 技术 ， 就 是 Gmail 上 那 种 AJAX 的 交互 方式 ， 可 以 拖 动 ， 可 以 用 鼠 
标 右 键 ， 也 可 以 用 组 合 键 ， 操 作 完 毕 还 不 刷新 页 面 ， 管 理 商 品 如 有 神 
助 ， 帅 采 了 。 我 是 这 个 项 目的 项 目 经 理 ， 一 灯 是 产品 经 理 ， 我 们 再 拉 
上 万 剑 和 一 伙 工 程 师 就 开始 行动 了 。 我 们 热火 朝天 地 干 了 三 个 月 ， 快 
要 完成 的 时 候 ， 老 马 突然 出 现在 我 身后 ， 看 我 操作 了 一 遍 新 版 “我 的 淘 
宇 ” 之 后 ， 问 我 这 是 不 是 客户 端 软件 ， 我 说 是 网 页 ， 他 抓 狂 了 ， 说 这 跟 
客户 端 软 件 一 样 ， 链 接 下 面 的 下 画 线 都 没有 ， 上 下 架 用 文件 夹 表 示 ， 
他 都 不 知道 怎么 操作 ， 卖 家 肯定 也 不 会 玩 。 


友 4 钻 5 年 质保 去 SANDISK Ultra ll SD 1G 高 速 SD 行货 防伪 查询 加 购 昌 后 


团购 价 : 270. O00 


运 费 : 平 训 :50 元 快递 :150 元 EMS:21.0 泡 


还 差 500000 件 就 可 团购 ! 


二 大 立 刻 团购 有 


- 此 宝贝 支持 支付 宝 ， 网 上 汇款 兔 手续 费 。 
收 货 满 意 后 卖家 才能 拿 钱 ， 货 款 都 安全 ! 


商城 认证 卖家 销售 ， 正 品质 量 保障 ， 章 守 


国家 三 包 ， 并 骨 淘 宝 网 提供 先行 赔付 - 


剩 仿 时 间 : 0 小 时 00 分 钟 41 称 


已 预订 数 : 20000 件 团购 最 小 数 : 140 件 
新 旧 程 度 : 全 新 所 在 地 : 北京 
宝贝 数 倒 : 8 性 浏览 量 : 次 


页 面 如 下 图 所 示 : 看 看 这 神 乎 其 技 的 翻 页 条 、 精 致 的 文件 夹 结 
构 、 人 性 化 的 多 选 框 ， 还 有 一 个 类 似 Excel 的 冰 结 窗口 的 功能 ， 这 有 多 
么 性 感 啊 ! 


免费 注册 营 录 搜索 淘宝 旺旺 收藏 支付 宝 客服 中 心 
渔 = | Taobao.com 我 要 买 | | 我 要 卖 | | 我 的 淘宝 | 诚信 安全 | [社区 | 
可 里 巴巴 旗 站 re 


我 的 淘宝 首页 宝贝 管理 交易 管理 留言 管理 收藏 夫 信用 评价 控制 面板 


地 我 的 店铺 ”二 发 布 宝贝 he 


口 编辑 口 重新 发 布 “ 门 入 窗 推荐 ” 门 第 先 门 显示 方式 ” 门 更 多 功能 
一 一 图 片 名 称 出 售 方式 价格 (元 ) 支付 宝 《有 效 期 “剩余 时 间 ”剩余 数量 。 浏览 量 “出价 次 数 
~ 
出 售 状 口 、= 全 新 iPod Yide。 306 香港 行 售 特 页 一 口 从 12.00 支持 ”14 天 2 名 
名 全 部 宝贝 
和 合 床 轩 的 宝 内 口 “ 国 苹果 专卖 店 行货 , 白色，irod nane 46/. 一 口 价 1379.00 支持 1 天。 2 名 
.说 货架 上 的 宝贝 
国 预 售 
加 Ee] 出售 中 | 口 夯 看 看 哦 ，9 成 新 行货 2 甩 了 哦 ， 只 要 1900 一口 价 89.00 支持 14 天 2 分 钟 
3 已 结束 
司 未 售 出 回 前 【iPod】Shuff1e 多 彩 随 心 护 套 -四 件 装 一 口 价 178.00 ”支持 14 天 ”2 分 钟 
梧 部 分 售 出 
梧 全 部 售 出 = 可 
中 . 转 推 荐 位 器 全 新 iPod Vi de。 306 香港 行货 特 页 一 口 价 123 支持 14 天 ”2 分 钟 5 S21 3 
司 和 柏 窗 推荐 oy 
上 店铺 推荐 可 | 苹果 专卖 店 行货 , 白色，iPod nano 46/ 一 口 价 1.00 支持 14 天 2 分 钟 5 521 
司 历史 库 
口 E 看 看 哦 ，9 成 新 行货 2 用 了 哦 ， 只 要 1900 一 口 价 19.00 ”支持 14 天 2 分 钟 
江 克 
全 选 ~ 上 一 页 EL 5 2 下 一 页 


老 马 果然 是 神 一 样 的 人 物 ， 他 说 的 应 验 了 ， 淘 宝 历史 上 第 一 个 群 
体 性 事件 爆发 了 ， 试 用 完 新 版 本 的 “我 的 淘宝 ”之 后 ， 很 多 卖家 愤怒 
了 ， 说 不 会 玩 儿 。 一 灯 就 和 承志 一 起 商量 怎么 把 页 面 改 得 像 网 页 一 
点 ， 改 了 半 个 月 ， 异 怒 依 然 没 有 平息 。 我 很 无 奈 地 看 着 这 两 个 人 在 那 
里 坚持 ， 然 后 跟 老 板 们 商量 怎么 办 。 后 来 我 们 到 论坛 上 让 大 家 投票 要 
不 要 使 用 新 版 “我 的 淘宝 ”， 投 票 结果 是 一 半 以 上 的 人 反对 。 于 是 这 十 
来 个 人 做 了 3 个 月 的 系统 被 杀 掉 了 。 这 让 我 非常 泪 来 ， 但 最 痛苦 的 还 不 
是 这 个 ， 我 们 下 线 之 后 ， 另 外 一 拨 卖 家 不 满 了 ， 说 这 么 好 的 功能 怎么 
没有 了 ? 这 个 产品 带 给 我 们 的 是 新 技术 (AJAX、prototype 框 架 ) 的 尝 
试 ， 以 及 新 技术 对 用 户 操 作 习 惯 的 改变 ， 一 定 要 慎之 又 慎 。 另 外 ， 还 
有 一 点 没有 总 结 好 的 教训 ， 就 是 应 对 群体 事件 的 时 候 ， 我 们 手足 无 
措 ， 在 后 来 “ 招 财 进 宝 >” 和 淘宝 商城 出 现 群体 性 事件 的 时 候 ， 我 发 现 悲 
剧 在 重演 。 

说 到 “ 招 财 进 宝 ”， 这 个 是 最 悲剧 的 产品 。 在 2006 年 “五 一 ”的 时 候 ， 
一 个 划时代 的 项 目 启动 了 。 财 神 说 要 用 最 好 的 项 目 阵 容 ， 我 被 选中 
了 ， 这 一 下 让 我 觉得 我 能 划分 到 最 好 的 员工 之 类 ， 在 “我 的 淘宝 ”这 个 
产品 中 严重 受伤 的 心 又 痊愈 了 。 这 是 一 个 商品 P4P 的 系统 ， 就 是 按 成 交 
付费 。 我 们 认为 已 经 有 很 多 卖家 有 钱 了 ， 但 淘宝 上 这 么 多 的 商品 ， 他 
们 很 难 被 找到 ， 卖 家 愿意 花 钱 让 商品 排 在 前 面 。 我 们 允许 卖家 购买 广 
告 位 ， 把 他 的 商品 按 一 定 算法 给 出 排名 (类 似 于 百度 的 竞价 排名 ， 但 


不 仅仅 看 他 出 了 多 少 钱 ， 还 要 看 信用 、 成 交 量 、 被 收藏 数量 等 ， 这 个 
算法 弄 得 巨 复 杂 ) 。 这 是 一 个 多 么 牛 的 盈利 模式 啊 ! 

这 个 系统 进行 得 很 顺利 ， 但 发 布 的 上 时候， 更 大 的 群体 性 事件 出 来 
了 ， 买 家 们 质疑 : 你 们 不 是 承诺 三 年 不 收费 吗 ? 收 广告 费 不 是 收费 
吗 ? 后 来 我 们 的 竞争 对 手 又 推波助澜 ， 公 关公 司 和 圈子 里 各 路 大 侠 上 
蹄 下 跳 ， 甚 至 同行 推出 了 “一 键 搬家 ”的 功能 来 收纳 我 们 的 会 员 。 一 时 
间 ， 和 与 论 哗然 ， 各 种 矛头 都 指 了 过 来 。 为 了 收场 ， 我 们 又 一 次 在 论坛 
中 让 用 户 投 票 决 定 产品 是 否 下 线 ， 同 “我 的 淘宝 ”一 样 ， 以 翡 剧 收场 。 
也 如 同 “ 我 的 淘宝 ”一 样 ， 下 线 后 ， 一 拨 尝 到 甜头 的 卖家 说 ， 这 么 好 的 
功能 怎么 没有 了 ? 《直到 Yahoo 中 国 合并 之 后 ， 开 发 了 淘宝 直通 车 ， 才 
以 类 似 的 产品 形态 满足 了 这 部 分 需求 。) 

虽然 “ 招 财 进 宝 ”失败 了 ， 但 这 个 项 目 中 对 技术 的 探索 更 加 深入 ， 
其 中 用 到 了 用 户 行为 追踪 、AJAX 等 ， 而 且 有 一 个 技术 的 细节 非常 经 
典 ， 淘 宝 商 品 详情 页 面 每 天 的 流量 有 几 个 亿 ， 里 面 的 内 容 都 是 放 在 绥 
存 里 的 ， 做 “ 招 财 进 宝 ” 的 时 候 ， 我 们 要 给 卖家 显示 他 的 商品 被 浏览 的 
次 数 〈 见 下 图 ) ， 这 个 数字 必须 实时 更 新 ， 而 用 缓存 一 般 都 是 异步 更 
新 的 ， 所 以 ， 一 开始 根本 没 考虑 把 这 个 数据 放 入 缓存 里 。 我 们 的 商品 
表 里 增 加 了 这 样 一 个 字段 ， 每 增加 一 个 PV， 该 字段 就 要 更 新 一 次 。 发 
布 一 个 小 时 后 ， 数 据 库 就 挂 掉 了。 数据 库 撑 不 住 息 么 办 ? 一般 的 缓存 
策略 是 不 支持 实时 更 新 的 ， 这 时 候 多 隆 大 神 想 了 个 办 法 ， 在 Apache 上 
面 写 了 一 个 模块 ， 这 个 数字 根本 不 经 过 下 层 的 WebApp 容 器 (只 经 过 
Apache) 就 写 入 一 个 集中 式 的 缓存 区 了 ， 这 个 缓存 区 的 数据 再 异步 更 
新 到 数据 库 。 这 就 是 我 前 面 提 到 的 ， 整 个 商品 详情 的 页 面 都 在 缓存 中 
了 ， 把 缓存 用 到 了 极致 。 


价格 : 本 .80 去 
物流 运费 : 广东 广州 | 至 浙江 杭州 。 快 涕 :8.00 元 


30 天 售 出 ; “156 御 


2 评价 : 离 坎 高 高 南 4.8 分 | 118 条 评价 
E33 宝 由 类型: 全 新 | 3585 次 浏览 


接 下 来 ， 我 们 就 说 说 缓存 的 技术 吧 。 


淘宝 在 很 早 就 开始 使 用 缓存 技术 了 ， 在 2004 年 的 时 候 ， 我 们 使 用 
一 个 叫做 ESI (Edge Side Includes) 的 缓存 (Cache) 。 在 决定 采用 ESI 
之 前 ， 多 隆 试用 了 Java 的 很 多 Cache， 但 都 比较 重 ， 后 来 用 了 Oracle 
Web Cache， 也 经 常 挂 掉 ，Oracle Web Cache 也 支持 ESI， 多 隆 由 此 发 现 
了 ESI 这 个 好 东 东 。ESI 是 一 种 数据 缓冲 /缓存 服务 器 ， 它 提供 将 Web 网 
页 的 部 分 (这 里 指 页 面 的 片段 ) 进行 缓冲 /缓存 的 技术 及 服务 。 以 往 的 
数据 缓冲 服务 器 和 信息 传送 服务 以 “页 ”为 单位 制作 ， 复 制 到 数据 缓冲 
服务 器 中 ， 这 用 于 处 理 静 态 页 面 很 有 效 ， 但 在 面 对 动 态 内 容 的 时 候 ， 
就 很 难得 到 高 效率 。 在 ESI 中 是 部 分 的 缓冲 网 页 ， 使 用 基于 XML 的 标记 
语言 ， 指 定 想 要 缓冲 的 页 面部 分 。 由 此 ， 页 面 内 分 为 动态 地 变更 部 分 
和 静态 的 不 变更 部 分 ， 只 将 静态 的 部 分 有 效 地 发 送 到 服务 器 中 。 淘 宝 
网 的 数据 虽然 大 部 分 都 是 动态 产生 的 ， 但 页 面 中 的 静态 片段 也 有 很 
多 ， 例 如 ， 页 面 的 头 、 尾 ， 商 品 详情 页 面 的 卖家 信息 等 〈 如 下 图 右 
侧 ) ， 这 些 最 早 都 是 从 ESI 缓 存 中 读 取 的 。 

ESI 解 决 了 页 面 端 静态 片段 的 缓存 ， 聪 明 的 读者 可 能 马上 就 想到 
了 ， 在 后 端的 那些 数据 能 不 能 使 用 缓存 ? 显然 也 是 可 以 的 ， 而 且 是 必 
需 的 。 例 如 ， 一 个 大 卖家 的 商品 和 店铺 ， 一 天 的 浏览 量 可 能 是 几 百 万 
个 ， 一 个 小 卖家 的 可 能 只 有 几 个 ， 那 么 这 个 大 卖家 的 用 户 信息 要 是 每 
次 都 从 数据 库 中 读 取 ， 显 然 不 划算 ， 要 是 把 这 个 信息 放 在 内 存 中 ， 每 
次 都 从 内 存 里 取 ， 人 性 能 要 好 很 多 。 这 种 应 用 场景 就 是 memcached 这 种 
Key-Value 缓 存 的 用 武之 地 。 只 可 惜 ， 在 淘宝 急需 要 memcached 的 时 
候 ， 它 还 没有 窑 露 头角 ( 它 于 2003 年 6 月 出 现 ， 但 近 几 年 才 火 爆 起 来 ， 
当时 没 发 现 它 ) 。 我 们 的 架构 师 多 隆 大 神 再 一 次 出 手写 了 一 个 缓存 系 
统 ， 叫 TBstore， 这 是 一 个 分 布 式 的 基于 Berkeley DB 的 缓存 系统 ， 推 出 
之 后 ， 在 阿里 巴巴 集团 内 部 使 用 非常 广泛 ， 特 别 是 对 于 淘宝 ，TBstore 
上 应 用 了 ESI (就 是 上 面 说 过 的 那个 ESI) 、 Checkcode (验证 码 ) 、 
Description (前 文 说 过 的 商品 详情 ) 、Story (心情 故事 ， 商 品 信息 里 面 
的 一 个 大 字段 ， 长 度 仅 次 于 商品 详情 ) 、 用 户 信息 等 内 容 。 


价格 : 3098.00 天 已 签署 消费 者 保障 协议 
物流 运费 : ”上 海 | 至 浙江 杭州 - ”快递 :20.00 元 查看 购物 须知 明确 售后 权益 
30 天 售 出 : 0 件 

评 ” 价 : 暂 无 评价 

宝贝 类 型 : 全 新 | 2799 次 浏览 


术 相 符 :4.7 ”3 1.67% 


颜色 分 类 第 闪 平一 灰 “| 史 坦 红 美 钻 黑 服务 态度 :4.7 ”E32.28% 
发 货 速 度 :4.7 0.67% 

购买 数量 1 + | 件 (库存 91 件 ) 
好 评 率 :98.53% 宝贝 数 :1192 
时 | 旺 池 

支付 : 本 信用 卡 分 期 快 如 支付 服务 : 性 力 


进入 店铺 收藏 店铺 ~ 


TBstore 的 分 布 式 算 法 实现 : 根据 保存 的 Key (关键 字 ) ， 对 key 进 
行 Hash 算 法 ， 取 得 Hash 值 ， 再 对 Hash 值 与 总 Cache 服 务 器 数据 取 模 。 然 
后 根据 取 模 后 的 值 ， 找 到 服务 器 列表 中 下 标 为 此 值 的 Cache 服 务 器 。 由 
Java Client API 封 装 实 现 ， 应 用 无 须 关 心 。 

TBstore 有 一 个 优点 ， 这 也 是 它 的 弱点 ， 它 的 存储 是 基于 Berkeley 
DB 的 ， 而 Berkeley DB 在 数据 量 超 过 内 存 的 时 候 ， 就 要 往 磁 盘 上 写 数据 
了 ， 所 以 ， 它 是 可 以 做 持久 化 存储 的 。 但 是 一 旦 往 磁 盘 写 入 数据 ， 作 
为 缓存 的 性 能 就 大 幅 下 降 。 

这 时 又 有 一 个 项 目 ， 推 动 了 淘宝 在 缓存 方面 的 技术 提升 。 在 2007 
年 ， 我 们 把 淘宝 的 用 户 信息 独立 出 来 ， 形 成 一 个 中 心 系统 UIC (User 
Information Center) ， 因 为 淘宝 所 有 的 功能 都 要 依赖 于 用 户 信 息 ， 所 以 
这 个 模块 必须 单独 拿 出 来 ， 否 则 以 后 的 系统 无 法 扩展 。 把 UIC 拿 出 来 以 
后 ， 应 用 系统 访问 UIC，UIC 访 问 数据 库 取得 用 户 信息 ， 粗 算 一 下 ， 每 
天 要 取 几 十 亿 条 的 用 户 信息 ， 知 直接 查询 数据 库 ， 数 据 库 肯定 会 朋 
溃 ， 这 里 必须 要 用 缓存 。 于 是 多 隆 专门 为 UIC 写 了 一 个 缓存 系统 ， 取 名 
叫做 TDBM。TDBM 扫 奔 了 Berkeley DB 的 持久 功能 ， 数 据 全 部 存放 在 
内 存 中 。 到 2009 年 ， 多 隆 又 参考 了 memcached 的 内 存 结构 ， 改 进 了 
TDBM 的 集群 分 布 方式 ， 在 内 存 利用 率 和 吞吐 量 方面 又 做 了 大 幅 提 
升 ， 推 出 了 TDBM 2.0 系 统 。 


下 图 是 一 个 关键 应 用 的 实时 监控 信息 ， 第 一 行 是 UIC 的 缓存 命中 
率 ， 可 以 看 到 有 99.2% 之 高 。 换 句 话 说 ， 也 就 是 给 数据 库 减 少 了 99.2% 
的 压力 。 
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由 于 TDBM、TBstore 的 数据 接口 和 用 途 都 很 相似 ， 开 发 团队 把 二 
者 合并 ， 推 出 了 淘宝 自 创 的 Key-Value 缓 存 系统 Tair (TaoBao Pair 
的 意思 ，Pair 即 Key-Value 数 据 对 ) 。Tair 包 括 缓存 和 持久 化 两 种 存储 功 
能 。Tair 作 为 一 个 分 布 式 系统 ， 由 一 个 中 心 控制 节点 和 一 系列 的 服务 节 
点 组 成 ， 我 们 称 中心 控 制 节点 为 Config Server ， 服 务 节 点 是 Data 
Server。 Config Server 负责 管理 所 有 的 Data Server， 维 护 Data Server 的 
状态 信息 。Data Server 对 外 提供 各 种 数据 服务 ， 并 以 心跳 的 形式 将 自 
身 的 状况 汇报 给 Config Server。 Config Server 是 控制 点 ， 而 且 是 单 点 ， 
目前 采用 一 主 一 备 的 形式 来 保证 其 可 靠 性 。 所 有 的 Data Server 地 位 都 是 
等 价 的 。Tair 的 架构 图 如 下 图 所 示 。 
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系统 部 署 结构 如 下 图 所 示 。 
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目前 ，Tair 支 撑 了 淘宝 几乎 所 有 系统 的 缓存 信息 。Tair 已 开源 ， 地 
址 为 code.taobao.orgo 


在 创造 了 TFS 和 Tair 之 后 ， 整 个 系统 的 架构 如 下 图 所 示 。 
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在 这 个 时 候 ， 研 发 部 对 搜索 引擎 iSearch 也 进行 了 一 次 升级 ， 
的 搜索 引擎 是 把 数据 分 到 多 台 机 器 上 ， 但 是 每 份 数据 只 有 一 份 ， 
是 每 份 数 据 变 成 多 份 ， 整 个 系统 从 一 个 单行 的 部 署 变 成 了 和 矩阵 ， 
支撑 更 大 的 访问 量 ， 并 且 做 到 很 高 的 可 用 性 。 


到 2007 年 ， 淘 宝 网 日 均 PV 达 到 2.5 亿 个 ， 商 品 数 超过 1 亿 个 ，、 


会 员 数 达 5 干 多 万 个 ， 全 网 成 交 额 达 433 亿 元 。 
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第 5 章 分 布 式 电子 商务 操作 系统 


在 飞速 发 展 的 背后 ， 隐 患 已 经 埋 下 。 在 技术 架构 的 制约 下 ， 团 队 
协作 越 来 越 艰难 ， 代 码 越 来 越 腔 肿 ， 开 发 的 效率 越 来 越 低 ， 新 业务 的 
需求 越 来 越 多 ， 老 业务 的 压力 眼看 就 要 超过 系统 的 容量 了 。 这 时 候 ， 
架构 该 做 怎样 的 调整 ?又 一 次 的 脱胎 换 骨 ， 和 欲火 重生 。 重 生 后 ， 在 分 
布 式 的 电子 商务 操作 系统 下 ， 我 们 才 敢 举办 一 次 又 一 次 的 “ 双 十 一 ” 活 
动 。 

服务 化 

中 间 件 

Session 框 架 

开放 平台 

在 系统 发 展 的 过 程 中 ， 架 构 师 的 眼光 至 关 重 要 ， 作 为 程序 员 ， 只 
要 把 功能 实现 即 可 ， 但 作为 架构 师 ， 要 考虑 系统 的 扩展 性 、 重 用 性 ， 
对 于 这 种 敏锐 的 感觉 ， 有 人 说 是 一 种 “代码 洁癖 ”。 淘 宝 早 期 有 几 个 架 
构 师 具备 了 这 种 感觉 ， 周 悦 虹 开 发 的 webx 是 一 个 扩展 性 很 强 的 框架 ， 
行 癫 在 这 个 框架 上 插入 了 数据 分 库 路 由 的 模块 、Session 框 架 等 。 在 做 
淘宝 后 台 系 统 的 时 候 ， 同 样 需要 这 几 个 模块 ， 行 癫 指导 我 把 这 些 模 块 
单独 打 成 JAR 包 。 另 外 ， 在 做 淘宝 机 票 、 彩 票 系统 的 时 候 ， 页 面 端 也 有 
很 多 东西 需要 复 用 ， 最 直观 的 是 页 届 和 页 脚 ， 一 开始 ， 我 们 的 每 个 系 
统 中 都 复制 了 一 份 ， 但 奇妙 的 是 ， 那 段 时 间 页 脚 要 经 常 修改 ， 例 如 ， 
把 “雅虎 中 国 * 改 成 “中 国 雅 虎 ”"， 过 一 段 时 间 又 加 了 一 个 “口碑 网 *"， 再 过 
一 段 时 间 变 成 了 “雅虎 口碑 ”， 最 后 又 变 成 了 “中 国 雅 虎 ”。 后 来 我 就 把 这 
部 分 Velocity 模板 独立 出 来 做 成 了 公用 的 模块 。 


阿里 巴巴 集团 国际 站 中 文 站 全 球速 卖 通 | 淘宝 网 | 天 猎 淘 | 阿里 云 | 中 国 雅虎 | 支付 宝 | 聚 划 算 | 更 多 ~ 
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上 面 说 的 都 是 比较 小 的 复 用 模块 ， 到 2006 年 ， 我 们 做 了 一 个 商品 
类 目 属 性 的 改造 ， 在 类 目 中 引入 了 属性 的 概念 。 项 目的 代号 叫做 “ 泰 
山 ”， 如 同 它 的 名 字 一 样 ， 这 是 一 个 举足轻重 的 项 目 ， 这 个 改变 是 一 个 
划时代 的 创新 。 在 这 之 前 的 三 年 时 间 内 ， 商 品 的 分 类 都 是 按照 树 状 一 
级 一 级 的 节点 来 分 的 ， 随 着 商品 数量 的 增长 ， 类 目 也 变 得 越 来 越 深 ， 
且 越 来 越 复杂 ， 这 样 ， 买 家 如 果 要 查找 一 件 商品 ， 就 要 了 逐 级 打开 类 
目 ， 找 商品 之 前 要 弄 清 商品 的 分 类 。 而 淘宝 运营 部 门 管理 类 目的 小 二 
也 发 现 了 一 个 很 严重 的 问题 ， 例 如 ， 男 装 里 有 T 恤 、T 恤 下 面 有 耐克 、 
耐克 有 纯 棉 的 ， 女 装 里 也 有 T 恤 、TI 恤 下 面 还 是 有 了 耐克、 耐克 下 面 依然 
有 纯 棉 的 ， 那 是 先 分 男女 装 ， 再 分 款式 、 品 牌 和 材质 呢 ， 还 是 先 分 品 
牌 ， 再 分 款式 、 材 质 和 男女 装 呢 ? 弄 得 很 乱 。 这 时 候 ， 一 位 大 侠 出 来 
了 一 灯 ， 他 说 品牌 、 款 式 、 材 质 等 都 可 以 叫做 * 属 性 ”， 属 性 是 类 
似 Tag 〈 标 签 ) 的 一 个 概念 ， 与 类 目 相 比 更 加 离散 、 灵 活 ， 这 样 也 缩减 
了 类 目的 深度 。 这 个 思想 的 提出 一 举 解 决 了 分 类 的 难题 ! 从 系统 的 角 
度 来 看 ， 我 们 建立 了 “属性 ”这 样 一 个 数据 结构 ， 由 于 除了 类 目的 子 节 
点 有 属性 外 ， 父 节点 也 可 能 有 属性 ， 于 是 类 目 属性 合 起 来 也 是 一 个 结 
构 化 的 数据 对 象 。 这 个 做 出 来 之 后 ， 我 们 把 它 独 立 出 来 作为 一 个 服 
务 ， 叫 做 Catserver (Category Server) 。 跟 类 目 属性 密切 关联 的 商品 搜 
索 功 能 独立 出 来 ， 叫 做 Hesper (金星 ) 。Catserver 和 Hesper 供 淘宝 的 前 
后 台 系 统 调用 。 

现在 淘宝 的 商品 类 目 属 性 已 经 是 全 球 最 大 的 ， 几 乎 没有 什么 类 目 
的 商品 在 淘宝 上 找 不 到 (除了 违禁 的 ) ， 但 最 初 的 类 目 属 性 改造 完 
后 ， 我 们 很 缺乏 属性 数据 ， 尤 其 是 数码 类 。 从 哪里 弄 这 些 数据 呢 ? 我 
们 跟 “ 中 关 村 在 线 * 合 作 ， 拿 到 了 很 多 数据 ， 那 个 时 候 ， 很 多 商品 属性 
信息 的 后 边 标 注 着 : “来自 中 关 村 在 线 ”"。 有 了 类 目 属性 ， 给 运营 工作 
带 来 了 很 大 的 便利 ， 我 们 知道 淘宝 的 运营 主要 就 是 类 目的 运营 ,什么 
季节 推 什么 商品 ， 都 要 在 类 目 属性 上 做 调整 ， 让 买 家 更 容易 找到 。 例 
如 ， 夏 天 让 用 户 在 女装 一 级 类 目下 标 出 材质 是 不 是 蕾丝 的 、 是 不 是 纯 
棉 的 ， 冬 天 却 要 把 羽 绕 衣 调 到 女装 一 级 类 目下 ， 什 么 流行 ， 就 要 把 什 
么 商品 往 更 高 级 的 类 目 调 整 。 这 样 类 目 和 属性 要 经 常 调整 ， 随 之 而 来 
的 问题 就 出 现 了 调整 到 哪个 类 目 ， 所 属 商 品 的 卖家 就 要 编辑 一 次 


自己 的 商品 ， 随 着 商品 量 的 增长 ， 卖 家 的 工作 量 越 来 越 大 ， 他 们 肯定 
受 不 了 。 到 了 2008 年 ， 我 们 研究 了 超市 里 前 后 台 商 品 的 分 类 ， 发 现 超 
市 前 台 商 品 可 以 随 季 节 和 关联 来 调整 摆 放 场景 〈 例 如 著名 的 啤酒 和 尿 
布 的 关联 ) ， 后 台 仓 库 里 要 按照 自然 类 目 来 存储 ， 二 者 密切 关联 ， 却 
又 相互 分 开 。 这 样 卖 家 发 布 商品 选择 的 是 自然 类 目 和 属性 ， 淘 宝 前 台 
展示 的 是 根据 运营 需要 摆 放 商品 的 类 目 和 属性 。 改 造 后 的 类 目 属 性 服 
务 取 名 为 Forest (和 森林 ， 与 类 目 属性 有 点 神似 。Catserver 还 用 于 提供 卖 
家 授权 、 品 牌 服务 、 关 键 词 等 相关 的 服务 ) 。 类 目 属性 的 服务 化 是 淘 
宝 在 系统 服务 化 方面 做 的 第 一 个 探索 。 

虽然 个 别 架构 师 具备 了 “代码 洁 辛 *"， 但 淘宝 前 台 系 统 的 业务 量 和 
代码 量 还 是 呈 爆 炸 式 的 增长 。 业 务 方 总 在 后 面 催 ， 开 发 人 员 不 够 就 继 
续 招 人 ， 招 来 的 人 根本 看 不 懂 原 来 的 业务 ， 只 好 摸索 着 在 “合适 的 地 
万” 加 一 些 “ 合 适 的 代码 ”>， 看 看 运行 起 来 像 那么 回 事后 ， 就 发 布 上 线 。 
在 这 样 的 恶性 循环 中 ， 系 统 越 来 越 及 肿 ， 业 务 的 耦合 性 越 来 越 高 ， 开 
发 的 效率 越 来 越 低 。 借 用 当时 比较 流行 的 一 句 话 “ 你 写 一 段 代码 ， 编 译 
一 下 能 通过 ， 半 个 小 时 就 过 去 了 ; 编译 一 下 没 通过 ， 半 天 就 过 去 了 。” 
在 这 种 情况 下 ， 系 统 出 错 的 概率 也 逐步 增长 ， 常 常 是 你 改 了 商品 相关 
的 某 些 代 码 ， 发 现 交 易 出 问题 了 ， 甚 至 你 改 了 论坛 上 的 某 些 代码 ， 旺 
旺 出 问题 了 。 这 让 开发 人 员 苦 不 堪 言 ， 而 业务 方 还 认为 开发 人 员 办 事 
不 力 。 
大 概 是 在 2007 年 年 底 的 时 候 ， 研 发 部 空降 了 一 位 从 硅谷 来 的 高 管 
空 闻 大 师 。 空 闻 是 一 位 瘟 厚 的 长 者 ， 他 告诉 我 们 一 切 要 以 稳定 为 
中 心 ， 所 有 影响 系统 稳定 的 因素 都 要 解决 掉 。 例 如 ， 每 做 一 个 日 常 修 
改 ， 都 必须 对 整个 系统 回归 测试 一 遍 ， 多 个 日 常 修改 如 果 放 在 一 个 版 
本 中 ， 要 是 一 个 功能 没有 测试 通过 ， 整 个 系统 都 不 能 发 布 。 我 们 把 这 
个 叫做 “火车 模型 *?， 即 任何 一 个 乘客 没有 上 车， 都 不 许 发 车 。 这 样 做 
最 直接 的 后 果 就 是 火车 一 直 晚 点 ， 新 功能 上 线 更 慢 了 ， 我 们 能 明显 感 
觉 到 业务 方 的 不 满 ， 空 闻 的 压力 肯定 非常 大 。 

现在 回 过 头 来 看 看 ， 其 实 我 们 并 没有 理解 背后 的 思路 。 正 是 在 这 
种 要 求 下 ， 我 们 不 得 不 开始 改变 一 些 东 西 ， 例 如 ， 把 回归 测试 日 常 
化 ， 每 天 晚上 都 跑 一 遍 整 个 系统 的 回归 。 另 外 ， 在 这 种 要 求 下 ， 我 们 
不 得 不 对 这 个 起 级 复杂 的 系统 做 肢解 和 重 构 ， 其 中 复 用 性 最 高 的 一 个 
模块 一 一 用 户 信 息 模块 开始 拆 分 出 来 ， 我 们 叫 它 UIC (User Information 


Center) 。 在 UIC 中 ， 它 只 处 理 最 基础 的 用 户 信息 操 作 ， 例 如 ， 
getUserById、 getUserByName 等 。 


在 另 一 方面 ， 还 有 两 个 新 兴 的 业务 对 系统 基础 功能 的 拆 分 也 提出 
人 

票 (caipiao.taobao.com) 两 个 新 业务 ， 这 两 个 新 业务 在 商品 的 展示 和 交 
易 的 流程 上 都 跟 主 站 的 业务 不 一 样 ， 机 票 是 按照 航班 的 信息 展示 的 ， 
彩票 是 按照 双色 球 、 数 字 和 足球 的 赛程 来 展示 的 。 但 用 到 的 会 员 功 能 
和 交易 功能 是 与 主 站 差不多 的 ， 当 时 做 起 来 就 很 纠结 ， 因 为 如 果 在 主 
站 中 做 ， 会 有 一 大 半 跟 主 站 无 关 的 东西 ， 如 果 重 新 做 一 个 ， 会 有 很 多 
重复 建设 。 最 终 我 们 决定 不 再 给 主 站 添乱 了 ， 就 另起炉灶 做 了 两 个 新 
的 业务 系统 ， 从 查 lt ee aaa ee 
流程 都 重新 写 了 一 套 。 现 在 在 “我 的 淘宝 ”中 查看 交易 记录 的 时 候 ， 还 
能 发 现 “ 已 买 到 的 宝贝 * 中 把 机 票 和 彩票 男 外 列 出 来 了 ， 0 
到 普通 的 订单 中 。 在 当时 ， 如 果 已 经 把 人 会员、 交易、 商品、 评价 这 些 
模块 拆 分 出 来 ， 就 不 用 什么 都 重 做 一 遍 了 。 


上 的 淘宝 首页 “个 人 主页 好友 - 交易- 应 用 中 心 ” 设置- 消息 - 

帐号 管理 改名 了 。 知道 了 
朱子 柳 是。 国 我 的 支付 宝 v 
待 付款 (0) 。 待 确认 收 货 (1) 。 待 评价 (3) 。 收 货 地 址 管理 。 卖家 中 心 


i 辑 资 料 ”隐私 设置 
| 好 友 动 态 店铺 动态 与 我 相关 加 和 这 给 我 的 分 享 ne， 


) 我 的 小 分 队 RE 
;的 交易 
我 的 购物 车 
) 已 买 到 的 宝贝 
我 的 拍卖 

机 票 酒店 保险 
我 的 彩票 
我 的 网 游 
购买 过 的 店铺 


十 一 他 区 : # 发 现 小 而 美 # 我 刚刚 喜欢 了 一 个 很 不 错 的 小 而 美 U 站 -【 品 生活 】， 内 
容 很 新 颖 ， 淘 宝 的 情感 味 来 了 ， 你 也 来 看 看 。【 品 生活 】http://to.taobao.com/T 
UnsZky 
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从 “我 的 淘宝 ” 左 侧 导航 栏 可 看 出 ， 机 票 、 采 


a 


网 游 是 分 开 的 


Ke 


到 2008 年 初 ， 整 个 主 站 系统 (有 了 机 票 、 彩 票 系统 之 后 ， 把 原来 
的 系统 叫做 主 站 ) 的 容量 已 经 到 了 瓶颈 ， 商 品 数 在 1 亿 个 以 上 ，PV 在 
2.5 亿 个 以 上 ， 会 员 数 超过 了 5000 万 个 。 这 时 Oracle 的 连接 池 数 量 都 不 
够 用 了 ， 数 据 库 的 容量 到 了 极限 ， 即 使 上 层 系统 加 机 器 也 无 法 继续 扩 
容 ， 我 们 只 有 把 底层 的 基础 服务 继续 拆 分 ， 从 底层 开始 扩容 ， 上 层 才 
能 扩展 ， 这 才能 容纳 以 后 三 五 年 的 增长 。 

于 是 我 们 专门 启动 了 一 个 更 大 的 项 目 ， 即 把 交易 这 个 核心 业务 模 
块 拆 分 出 来 。 原 来 的 淘宝 交易 除了 跟 商 品 管理 耦合 在 一 起 ， 还 在 支付 
宝 和 淘宝 之 间 转 换 ， 跟 支付 宝 耦合 在 一 起 ， 这 会 导致 系统 很 复杂 ， 用 
户 体 验 也 很 不 好 。 我 们 把 交易 的 底层 业务 拆 分 出 来 ， 叫 交易 中 心 
(Trade Center，TC) ， 所 谓 底层 业务 ， 就 如 创建 订单 、 减 库存 、 修 改 
订单 状态 等 原子 型 的 操作 ; 交易 的 上 层 业 务 叫 交易 管理 (Trade 
Manager，TM) ， 例 如 ， 拍 下 一 件 普通 商品 要 对 订单 、 库 存 、 物 流 进 
行 操作 ， 拍 下 虚拟 商品 不 需要 对 物流 进行 操作 ， 这 些 在 TM 中 完成 。 这 
个 项 目 取 了 一 个 很 没有 创意 的 名 字 一 一 “千岛 湖 ”， 开 发 人 员 取 这 个 名 
字 的 目的 是 想 在 开发 完毕 之 后 ， 去 千岛 湖 玩 一 圈 ， 后 来 他 们 如 愿 以 偿 
了 。 这 个 时 候 还 有 一 个 淘宝 商城 的 项 目 在 做 ， 之 前 拆 分 出 来 的 那些 基 
础 服务 给 商城 的 快速 构建 提供 了 良好 的 基础 。 


类 目 属性 、 用 户 中 心 、 交 易 中 心 ， 随 着 这 些 模块 的 逐步 拆 分 和 服 
务 化 改造 ， 我 们 在 系统 染 构 方面 也 积 办 了 不 少 经 验 。 到 2008 年 年 底 就 
做 了 一 个 更 大 的 项 目 ， 把 淘宝 所 有 的 业务 都 模块 化 ， 这 是 继 2004 年 从 
LAMP 架 构 到 Java 架 构 之 后 的 第 二 次 脱胎 换 骨 。 我 们 对 这 个 项 目 取 了 一 


个 很 霸气 的 名 字 一 一 “五 彩 石 ”( 女 娲 炼 石 补 天 用 的 石头 ) 。 这 个 系统 
重 构 的 工作 非常 惊险 ， 有 人 称 为 “给 一 架 高 速 飞行 的 飞机 换 发 动机 ”。 
“五 彩 石 ? 项 目 发 布 之 后 ， 相 天 工程 师 去 海南 三 亚 玩 了 几 天 。 


看 看 三 亚 的 美景 ， 显 然 比 千 岛 湖上 了 好 大 一 个 档次 。 目 从 笔者 来 
到 淘宝 后 ， 已 经 不 下 五 次 去 过 千岛 湖 了 ， 但 每 次 有 新 项 目 庆 祝 的 时 
候 ， 总 还 有 很 多 新 人 高 呼 着 “去 千岛 湖 ! ”这 也 太 疫 追求 了 。 

他 们 把 淘宝 的 系统 拆 分 成 了 如 下 架构 。 


业务 力 系统 T™ 


核心 业务 服 完 
TOP 


基础 业务 服务 ”UIC Forest 


持久 层 (DB/TFS/VNAS) 


Notify 


其 中 ，UIC 和 Forest 在 上 文 已 说 过 ，TC、IC、SC 分 别 是 交易 中 心 
(Trade Center) 、 商 品 中 心 (Item Center) 、 店 铺 中 心 (Shop 
Center) ， 这 些 中 心 级 别 的 服务 只 提供 原子 级 的 业务 逻辑 ， 如 根据 ID 查 
找 商 品 、 创 建交 易 、 减 少 库存 等 操作 。 再 往 上 一 层 是 业务 系统 TM 
(Trade Manager， 交 易 业 务 ) 、IM (Item Manager， 商 品 业 务 ) 、SM 


(Shop Manager， 后 来 改名 叫 SS， 即 Shop System ， 店 铺 业 务 ) 、Detail 
(商品 详情 ) 。 

拆 分 之 后 ， 系 统 之 间 的 交互 关系 变 得 非常 复杂 ， 示 意图 如 下 所 
示 。 
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系统 这 么 拆 分 的 好 处 显而易见 ， 拆 分 之 后 的 每 个 系统 可 以 单独 部 
署 ， 业 务 简单 ， 方 便 扩 容 ; 有 大 量 可 重用 的 模块 便于 开发 新 的 业务 ; 
能 够 做 到 专人 专 事 ， 让 技术 人 员 更 加 专注 于 某 一 个 领域 。 这 样 要 解决 
的 问题 也 很 明显 ， 分 拆 之 后 ， 系 统 之 间 还 是 必须 要 打交道 的 ， 越 往 底 
层 的 系统 ， 调 用 它 的 客户 越 多 ， 这 就 要 求 底 层 的 系统 必须 具有 超大 规 
模 的 容量 和 非常 高 的 可 用 性 。 另 外 ， 拆 分 之 后 的 系统 如 何 通 信 ? 这 里 
需要 两 种 中 间 件 系统 ， 一 种 是 实时 调用 的 中 间 件 (淘宝 的 HSF， 高 性 能 
服务 框架 ) ， 一 种 是 异步 消息 通知 的 中 间 件 (淘宝 的 Notify) 。 另 外 ， 
一 个 需要 解决 的 问题 是 用 户 在 A 系 统 登录 后 ， 到 B 系 统 的 时 候 ， 用 户 的 
登录 信息 怎么 保存 ?这 又 涉及 一 个 Session 框 架 。 再 者 ， 还 有 一 个 软件 
工程 方面 的 问题 ， 这 么 多 层 的 一 套 系统 ， 怎 么 去 测试 它 ? 


中 间 件 


互联 网 系统 的 发 展 看 似 非常 专业 ， 其 实在 生活 中 也 存在 类 似 的 “ 系 
统 ”， 正 如 一 位 哲学 家 说 “太阳 底下 无 新 事 ”。 我 们 可 以 从 生活 中 的 一 个 
小 例子 来 看 网 站 系统 的 发 展 ， 这 个 例子 是 HSF 的 作者 毕 玄 写 的 。 

一 家 小 超市 ， 一 个 收银 员 ， 同 时 还 兼 着 干 点 其 他 的 事情 ， 例 如 ， 
打扫 卫生 、 摆 货 。 

来 买 东西 的 人 多 起 来 了 ， 排 队 很 长 ， 顾 客 受 不 了 ， 于 是 增加 了 一 
个 收银 台 ， 雇 了 一 个 收银 员 。 

忙 的 时 候 收银 员 根 本 疫 时 间 去 打扫 卫生 ， 超 市 内 有 和 点 脏 ， 于 是 雇 
了 一 个 专门 打扫 卫生 的 。 

随 着 顾客 不 断 增 加 ， 超 市 也 经 过 好 几 次 装修 ， 由 以 前 的 一 层 变 
了 两 层 ， 这 个 时 候 所 做 的 事情 就 是 不 断 增加 收银 全、 收银 员 和 打扫 卫 
生 的 人 。 

在 超市 运转 的 过 程 中 ， 老 板 发 现 一 个 现象 ， 有 些 收银 人 台 排 很 长 的 
队 ， 有 些 收 银 人 台 排 的 人 不 多 ， 了 解 后 知道 是 因为 收银 台 太 多 了 ， 顾 客 
根本 看 不 到 现在 各 个 收银 台 的 状况 。 对 于 这 个 现象 ， 一 种 简单 的 方法 
就 是 继续 加 收银 台 。 但 一 方面 ， 超 市 没 地 方 可 加 收银 台 了 ， 另 一 方 
面 ， 作 为 老板 ， 当 然 不 需要 雇 太 多 的 人 ， 于 是 开始 研究 怎样 让 顾客 了 
解 到 收银 台 的 状况 ， 简 单 地 加 了 一 个 摄像 尖 和 一 个 大 屏幕 ， 在 大 屏幕 
上 显示 目前 收银 人 台 的 状况 ， 这 样 基 本 解决 了 这 个 问题 。 

排队 长 度 差不多 后 ， 又 出 现 了 一 个 现象 ， 就 是 有 些 收银 台 速 度 明 
显 比 其 他 的 慢 ， 原 因 是 排 在 这 些 收 银 台 的 顾客 买 的 东西 特别 多 ， 于 是 
又 想 了 一 招 ， 就 是 设立 专门 的 10 件 以 下 的 通道 ， 这 样 买 东西 比较 少 的 
顾客 就 不 用 排 太 长 的 队 了 ， 这 一 招 施展 后 ， 顾 客 的 满意 度 明 显 提升 ， 
销售 额 也 好 了 不 少 ， 后 来 就 继续 用 这 招 应 对 团购 状况 、VIP 状 况 。 

在 解决 了 上 面 的 一 些 烦 心事 后 ， 老 板 关 注 到 了 一 个 存在 已 久 的 现 
象 ， 就 是 白天 收银 台 很 内 ， 晚 上 则 很 忙 ， 于 是 从 节省 成 本 上 考虑 ， 决 
定 实 行 部 分 员工 只 在 晚上 上 班 的 机 制 ， 白 天 则 关闭 一 些 收银 台 ， 顾 客 
仍然 可 以 通过 大 屏幕 看 到 哪些 收银 台 是 关闭 的 ， 避 人 免 走 到 没 人 的 收银 
台 去 ， 实 行 这 招 后 ， 成 本 大 大 降低 了 。 

这 个 生活 中 的 例子 及 其 解决 的 方法 ， 其 实 和 互联 网 网 站 发 展 过 程 
中 的 一 些 技术 是 非常 类 似 的 ， 只 是 在 技术 层面 用 其 他 名 词 来 表达 了 而 
已 ， 例 如 ， 有 集群 、 分 工 、 负 载 均 衡 、 根 据 QoS 分 配 资产 等 。 


e 集 群 : 所 有 的 收银 员 提 供 的 都 是 收银 功能 ， 无 论 顾客 到 哪 一 个 收 
银 员 面前 ， 都 可 完成 付款 ， 可 以 认为 所 有 的 收银 员 就 构成 了 一 个 集 
群 ， 都 希望 能 做 到 顾客 增加 的 时 候 只 需 增加 收银 员 融 行 。 在 现实 生活 
中 有 场地 的 限制 ， 而 在 互联 网 应 用 中 ， 能 否 集群 化 还 受 限 于 应 用 在 水 
平 伸缩 上 的 支撑 程度 ， 而 集群 的 规模 通常 会 受 限于 调度 、 数 据 库 、 机 
房 等 。 

e 分 工 : 收银 员 和 打扫 卫生 的 人 分 开 ， 这 种 分 工 容易 解决 ， 而 这 种 
分 工 在 互联 网 中 是 一 项 重要 而 复杂 的 技术 ， 没 有 现实 生活 中 这 么 简 
单 ， 涉 及 的 主要 有 按 功能 和 数据 库 的 不 同 拆 分 系统 等 ， 如 何 拆 分 以 及 
拆 分 后 如 何 交 互 是 需要 面临 的 两 个 挑战 。 因 此 ， 会 有 高 性 能 通信 框 
染 、SOA 平 台 、 消 息 中 间 件 、 分 布 式 数 据 层 等 基础 产品 的 诞生 。 

e 负 载 均 衡 : 让 每 个 收银 台 排 队 差不多 长 ， 设 立 小 件 通 道 、 团 购 通 
道 、VIP 通 道 等 ， 这 些 可 以 认为 都 是 集群 带 来 的 负载 均衡 的 问题 ， 从 技 
术 层 面 上 说 ， 实 现 起 来 自然 比 生活 中 复杂 很 多 。 

e 根 据 QoS 分 配 资源 : 部 分 员工 仅 在 晚上 上 班 的 机 制 在 现实 生活 中 
不 难 做 到 ， 而 对 互联 网 应 用 而 言 ， 就 是 一 件 复杂 而 且 极 具 挑 战 的 事 。 

参照 生活 中 的 例子 来 说 ， 在 面 对 用 户 增 长 的 情况 下 ， 想 出 这 些 招 
应 该 不 难 ， 不 过 要 掌握 以 上 四 点 涉及 的 技术 就 相当 复杂 了 ， 而 且 互 联 
网 中 涉及 的 其 他 很 多 技术 还 没 在 这 个 例子 中 展现 出 来 ， 例 如 缓存 、 
CDN 等 优化 手段 ， 运 转 状况 监测 、 功 能 降级 、 资 源 劣 化 、 流 控 等 可 用 
性 手段 ， 自 建 机 房 、 硬 件 组 装 等 成 本 控制 手段 。 因 此 ， 构 建 一 个 互联 
网 网 站 确实 是 不 容易 的 ， 技 术 含量 十 足 ， 当 然 ， 经 营 一 家 超市 也 不 简 
单 。 


高 性 能 服务 框架 HSF 


从 超市 的 运 维 可 以 抽象 出 系统 设计 的 一 些 思 路 ， 服 务 拆 分 之 后 ， 
如 何 取得 我 需要 的 服务 ? 在 “电视 机 ”上 ， 把 每 个 集群 能 提供 的 服务 显 
示 出 来 。 你 不 需要 关心 哪个 人 为 你 服务 ， 当 你 有 需要 的 时 候 ， 请 先 看 
头顶 的 电视 机 ， 它 告诉 你 哪个 服务 在 哪个 区 域 。 当 你 直接 去 这 个 区 域 
的 时 候 ， 系 统 会 给 你 找到 一 个 最 快速 的 服务 通道 。 


网 


这 就 是 HSF 的 设计 思想 ， 服 务 的 提供 者 启动 时 通过 HSF 框 架 向 
ConfigServer (类 似 超 市 的 电视 机 ) 注册 服务 信息 (接口 、 版 本 、 超 时 
时 间 、 序 列 化 方式 等 ) ， 这 样 ConfigServer 上 面 就 定义 了 所 有 可 供 调用 
的 服务 (同一 个 服务 也 可 能 有 不 同 的 版 本 ) ; 服务 调用 者 启动 的 时 候 
向 ConfigServer 注 册 对 哪些 服务 感 兴趣 (接口 、 版 本 ) ， 当 服务 提供 者 
的 信息 变化 时 ，ConfigServer 向 相应 的 感 兴趣 的 服务 调用 者 推送 新 的 服 
务 信息 列表 ; 调用 者 在 调用 时 则 根据 服务 信息 的 列表 直接 访问 相应 的 
服务 提供 者 ， 而 无 须 经 过 ConfigServer。 我 们 注意 到 ConfigServer 并 不 会 
把 服务 提供 者 的 IP 地 址 推送 给 服务 的 调用 者 ，HSF 框 架 会 根据 负载 状况 
来 选择 具体 的 服务 器 ， 返 回 结果 给 调用 者 ， 这 不 仅 统一 了 服务 调用 的 
方式 ， 也 实现 了 “ 软 负载 均衡 ”。 平 时 ConfigServer 通 过 和 服务 提供 者 的 
心跳 来 感应 服务 提供 者 的 存活 状态 。 

在 HSF 的 支持 下 ， 服 务 集群 对 调用 者 来 说 是 “统一 ”的 ， 服 务 之 间 是 
“隔离 ”的 ， 这 保证 了 服务 的 扩展 性 和 应 用 的 统一 性 。 再 加 上 HSF 本 身 能 
提供 的 “ 软 负载 均衡 ?”， 服 务 层 对 应 用 层 来 说 就 是 一 片 < 私 有 云 ” 了 。 


功能 分 组 1 | 功能 分 组 2 | 功能 分 组 3 


HSF 框 架 以 SAR 包 的 方式 部 署 到 Jboss、Jetty 或 Tomcat 下 ， 在 应 用 启 
动 的 时 候 ，HSF (High-Speed Service Framework， 在 开发 团队 内 部 有 一 
些 人 称 HSF 为 "好 舒服 ”) 服务 随 之 启动 。HSF 旨 在 为 淘宝 的 应 用 提供 一 
个 分 布 式 的 服务 框架 ，HSF 从 分 布 式 应 用 层面 以 及 统一 的 发 布 /调用 方 
式 层 面 为 大 家 提供 支持 ， 从 而 可 以 很 容易 地 开发 分 布 式 的 应 用 以 及 提 
供 或 使 用 公用 功能 模块 ， 而 不 用 考虑 分 布 式 领域 中 的 各 种 细节 技术 ， 
例如 ， 远 程 通 讯 、 性 能 损耗 、 调 用 的 透明 化 、 同 步 / 异 步调 用 方式 的 实 
现 等 问题 。 


了 


从 上 图 HSF 的 标志 来 看 ， 它 的 速度 是 很 快 的 。HSF 是 一 个 分 布 式 的 
标准 Service 方 式 的 RPC _ (Remote Procedure Call Protocol， 远 程 过 程 调用 
协议 ) 框架 ，Service 的 定义 基于 OSGI 的 方式 ， 通 讯 层 采用 TCP/IP 协 
议 。 关 于 分 布 式 的 服务 框架 的 理论 基础 ，HSF 的 作者 毕 辫 写 了 一 篇 博文 

(http : /www.blogjava.neVBlueDavy/archive/2008/01/24/177533.html ) 
， 有 关 基 于 OSGI 的 分 布 式 服务 框架 ， 也 有 一 系列 的 博文 
(http : /Wwww.blogjava.neVBlueDavy/archive/2008/01/14/175054.html ) 


O 


从 下 面 这 个 HSF 监 控 系 统 的 截图 中 可 以 更 直观 地 看 到 一 些 信 息 ， 在 
两 个 集群 中 有 两 个 服务 器 (其实 有 更 多 的 ， 没 有 全 部 截图 下 来 ) 都 提 
供 com.taobao.item.service.SpuGroupService 这 一 服务 ， 版 本 号 都 是 
1.0.0， ed sn 中 包含 超时 时 间 、 序 列 化 
万 式 。 在 后 面 那 条 信息 中 可 看 到 ， 在 展开 的 这 个 集群 中 服务 有 835 台 机 
器 已 订阅 ， 这 些 订阅 者 有 淘宝 的 服务 器 (cart 是 购物 车 功能 的 服务 
器 ) ， 也 有 hitao ( 淘 花 网 ) 的 服务 器 。 


HSFOPS *SpuU” Search 
共 获 取 到 1328 条 数据 ， 当 页 显示 1 条 至 20 条 ， 检 索 耗 时 : 286.794 毫 秒 
Data ID Group Name Host ID Type 
om.taobao.aladdin.service. rap.SpuRecommendService:1.0.0 [HSF] 172.24.00intas Provider 邓 也 
om.taobao.item.service.SpuGroupService:1.0.0 [NOHSF] 172.24 smu89 Provider 2 


een 122007CLIENTRETRYCONNECTIONTIMES=3&CLIENTRETRYCONNECTIONTIMEOUT=1000&_SERIALIZETYPE=java&_IDLETIMEOUT=10&_TIMEOUT=10000 
com.taobao.item.service.SpuGroupService:1.0.0 [HSF] 172.24. OWS Provider 立马 


该 服务 共有 835 台 机 器 订阅 ， 本 页 显示 前 63 条 数据 ， 详 细 数 据 请 查询 : 详细 数据 
[cart]172.23 冯 Wwey:49575 [cart]172.24 90W9:42042 [cart]172.24 Fyne6:36766 [cart]172.24.900006:54469 
[cart]172.24 WR 50364 [cart]172.24.50®R58214 [hitaoerp]172.24 用 556702 [hitaotradeface]172.24. WD:60221 


HSF 系 统 目 前 每 天 承担 了 300 亿 次 以 上 的 服务 调用 。 
一 些 读者 可 能 会 有 一 个 疑问 : 既然 淘宝 的 服务 化 是 渐进 式 的 ， 那 
么 在 HSF 出 现 之 前 ， 系 统 之 间 的 调用 采用 什么 方式 呢 ? 


这 个 有 点 “五 花 八 门 ”， 例 如 ， 对 于 类 目的 调用 方式 是 : Forest 打 包 
成 一 个 JAR 包 ， 在 应 用 局 动 的 时 候 装 载 到 内 存 中 ， 仅 这 一 个 JAR 包 所 占 
用 的 内 存 就 有 800MB 之 多 (因为 淘宝 的 类 目 数 据 太 庞大 了 ) ， 对 于 当 
时 一 般 只 有 2GB 内 存 的 开发 机 来 说 ， 加 载 完 类 目 信 息 后 ， 机 器 运行 速 


度 就 非常 慢 。 对 于 用 户 信 息 (UIC) 来 说 ， 一 开始 的 调用 方式 是 用 
Hessian 接 口 。 还 有 一 些 系统 是 通过 WebService、Socket 甚 至 是 HTTP 请 
求 来 相互 调用 的 。 每 种 调用 方式 都 涉及 各 种 超时 、 信 息 的 加 解密 、 参 
数 的 定义 等 问题 ， 由 此 可 见 ， 在 没有 HSF 之 前 ， 系 统 之 间 的 调用 是 错 综 
复杂 的 。 而 随 着 系统 拆 分 得 越 来 越 多 ， 必 须 由 一 个 统一 的 中 间 层 来 处 
理 这 种 问题 ，HSF 正 是 在 这 种 背景 下 诞生 的 。 


消息 中 间 件 Notify 


HSF 解 决 了 服务 调用 的 问题 ， 我 们 再 提出 一 个 很 早 就 说 过 的 问题 : 
用 户 在 银行 的 网 关 付 钱 后 ， 银 行 需要 通知 到 支付 宝 ， 但 银行 的 系统 不 
一 定 能 发 出 通知 ; 如 果 通 知 发 出 了 ， 不 一 定 能 通知 到 ; 如 果 通 知 到 
了 ， 不 一 定 不 重复 通知 一 遍 。 这 个 状况 在 支付 宝 持 续 了 很 长 时 间 ， 非 
常 痛 苦 。 支 付 宝 从 淘宝 剥离 出 来 的 时 候 ， 淘 宝 和 支付 宝 之 间 的 通信 也 
面临 同样 的 问题 ， 那 是 2005 年 的 事情 ， 支 付 宝 的 架构 师 鲁 肃 提 出 用 MQ 
(Message Queue) 的 方式 来 解决 这 个 问题 ， 我 负责 淘宝 这 边 读 取消 息 
的 模块 。 但 我 们 发 现 消息 数量 上 来 之 后 ， 常 常 造成 拥堵 ， 消 息 的 顺序 
也 会 出 错 ， 在 系统 挂 掉 的 时 候 ， 消 息 也 会 丢掉 ， 这 样 非常 不 保险 。 然 
后 鲁 肃 提出 做 一 个 系统 框架 上 的 解决 方案 ， 把 要 发 出 的 通知 存放 到 数 
据 库 中 ， 如 果实 时 发 送 失 败 ， 再 用 一 个 时 间 程 序 来 周期 性 地 发 送 这 些 
通知 ， 系 统 记 录 下 消息 的 中 间 状 态 和 时 间 惟 ， 这 样 保证 消息 一 定 能 发 
出 ， 也 一 定 能 通知 到 ， 且 通知 带 有 时 间 顺 序 ， 这 些 通知 甚至 可 以 实现 
事务 性 的 操作 。 

在 “千岛 湖 ” 项 目 和 “五 彩 石 ” 项 目 之 后 ， 淘 宝 自 家 的 系统 也 拆 成 了 很 
多 个 ， 他 们 之 间 也 需要 类 似 的 通知 。 例 如 ， 拍 下 一 件 商品 ， 在 交易 管 
理 系统 中 完成 时 ， 它 需要 通知 商品 管理 系统 减少 库存 ， 通 知 旺旺 服务 
系统 发 送 旺旺 提 醒 ， 通 知 物流 系统 上 门 取 货 ， 通 知 SNS 系 统 分 享 订单 ， 
通知 公安 局 的 系统 这 是 骗子 ..….... 用 户 的 一 次 请 求 ， 在 底层 系统 可 能 产 
生 10 次 的 消息 通知 。 这 一 大 堆 的 通知 信息 是 异步 调用 的 (如果 同步 ， 
系统 耦合 在 一 起 就 达 不 到 拆 分 的 目的 ) ， 这 些 消息 通知 需要 一 个 强大 
的 系统 提供 支持 ， 从 消息 的 数量 级 上 看 ， 比 支付 宝 和 淘宝 之 间 的 消息 
量 又 上 了 一 个 层次 ， 于 是 按照 类 似 的 思路 ， 一 个 更 加 强大 的 消息 中 间 


件 系统 就 诞生 了 ， 它 的 名 字 叫 做 Notify。Notify 是 一 个 分 布 式 的 消息 中 
间 件 系统 ， 支 持 消 息 的 订阅 、 发 送 和 消费 ， 其 架构 图 如 下 所 示 。 


Config Server 
7 SN 


订阅 关系 - rs 民 、 Ww 阅 关系 
| FS Nityl Noty 服 了 
务 器 列表 务 器 地 址 一 
中 发 送 消息 5 
| | Notify Client | | i 
ES 
消费 消息 二 


Database 


NotifyServer 在 ConfigServer 上 面 注 册 消 息 服务 ， 消 息 的 客户 端 通 过 
ConfigServer 订 阅 消 息 服 务 。 某 个 客户 端 调用 NotifyServer 发 送 一 条 消 
息 ，NotifyServer 负 责 把 消息 发 送 到 所 有 订阅 这 个 消息 的 客户 端 (这 个 
过 程 参照 HSF 一 节 ， 原 理 是 一 样 的 ) 。 为 了 保证 消息 一 定 能 发 出 ， 且 对 
方 也 一 定 能 收 到 ， 消 息 数 据 本 身 就 需要 记录 下 来 ， 这 些 信息 存放 在 数 
据 库 中 〈 可 以 是 各 种 数据 库 ) 。 由 于 消息 具有 中 间 状 态 〈 已 发 送 、 未 
发 送 等 ) ， 应 用 系统 通过 Notify 可 以 实现 分 布 式 事物 一 -BASE (基本 
可 用 (Basically Available) 、 软 状态 (Soft State) 、 最 终 一 致 

(Eventually Consistent) ) 。NotifyServer 可 以 水 平 扩展 ，NotifyClient 
也 可 以 水 平 扩 展 ， 数 据 库 也 可 以 水 平 扩展 ， 从 理论 上 讲 ， 这 个 消息 系 
统 的 吞吐 量 是 没有 上 限 的 ， 现 在 Notify 系 统 每 天 承载 了 淘宝 10 亿 次 以 上 
的 消息 通知 。 

下 图 展示 了 创建 一 笔 交 易 之 后 ，TC (交易 中 心 ) 向 Notify 发 送 一 
条 消息 ， 后 续 Notify 所 完成 的 一 系列 消息 通知 。 
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分 布 式 数据 访问 层 TDDL 


有 了 HSF 和 Notify 的 支持 ， 在 应 用 级 别 中 ， 整 个 淘宝 网 的 系统 可 以 
拆 分 了 ， 还 有 一 个 制约 系统 规模 的 更 重要 的 因素 ， 就 是 数据 库 ， 也 必 
须 拆 分 。 

在 第 二 部 分 中 讲 过 ， 淘 宝 很 早 就 对 数据 进行 过 分 库 的 处 理 ， 上 层 
系统 连接 多 个 数据 库 ， 中 间 有 一 个 叫做 DBRoute 的 路 由 来 对 数据 进行 统 
一 访问 。DBRoute 对 数据 进行 多 库 的 操作 、 数 据 的 整合 ， 让 上 层 系统 像 
操作 一 个 数据 库 一 样 操 作 多 个 库 。 但 是 随 着 数据 量 的 增长 ， 对 于 库 表 
的 分 法 有 了 更 高 的 要 求 ， 例 如 ， 你 的 商品 数据 到 了 百 亿 级 别 的 时 候 ， 
任何 一 个 库 都 无 法 存放 了 ， 于 是 分 成 2 个 、4 个 、8 个 、16 个 、32 个 .………. 
直到 1024 个 、2048 人 个。 好， 分 成 这 么 多 ， 数 据 能 够 存放 了 ， 那 怎么 查 
询 它 ? 这 时 候 ， 数 据 查 询 的 中 间 件 就 要 能 够 承担 这 个 重任 了 ， 它 对 上 


层 来 说 ， 必 须 像 查询 一 个 数据 库 一 样 来 查询 数据 ， 还 要 像 查询 一 个 数 
据 库 一 样 快 (每 条 查询 在 几 毫 秒 内 完成 ，TDDL 就 承担 了 这 样 一 个 工 
{Es 

另外 ， 加 上 数据 的 备份 、 复 制 、 主 备 切换 等 功能 ， 这 一 套 系统 都 
在 TDDL 中 完成 。 在 外 面 有 些 系统 也 用 DAL (数据 访问 层 ) 这 个 概念 
命名 这 个 中 间 件 。 

TDDL 实 现 了 下 面 三 个 主要 的 特性 : 

e 数 据 访问 路 由 一 一 将 针对 数据 的 读 写 请 求 发 送 到 最 合适 的 地 方 ; 

e 数 据 的 多 向 非 对 称 复制 一 一 次 写 入 ， 多 点 读 取 ; 

e 数 据 存 储 的 自由 扩展 一 一 不 再 受 限 于 单 台 机 器 的 容量 瓶颈 与 速度 
瓶 须 ， 平滑 迁移 。 


下 图 展示 了 TDDL 所 处 的 位 置 。 
I [Dmg Md 
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下 图 展示 了 一 个 简单 的 分 库 分 表 数 据 查询 策略 。 


下 面 是 TDDL 的 主要 开发 者 之 一 帝 询 讲述 的 “TDDL 的 前 世 今 生 ” 
数据 层 的 发 展 历程 。 
CommonDAO 的 时 代 
数据 切 分 并 不 算是 一 个 很 新 的 概念 ， 当 商品 库 切 分 为 两 个 时 ， 就 
已 经 出 现 了 名 字 叫 做 xingdian 〈 笑 ， 那 时 候 行 癫 已 经 不 写 代 码 了 ， 但 从 
代码 的 版 本 信息 可 以 看 到 作者 ) 的 人 写 的 Common DAO。 

CommonDAO 的 思路 非常 简单 实用 ， 因 为 淘宝 主要 在 使 用 ibatis 作 
为 访问 数据 库 的 DAO 层 ， 所以，CommonDAO 的 作用 就 是 对 ibatis 层 做 
了 一 个 很 浅 的 封装 ， 人 允许 你 通过 商品 字 串 ID 的 第 一 个 字符 来 访问 两 台 
数据 库 中 的 一 台 。 

比如 ， 如 果 字 符 串 ID 的 第 一 个 字符 是 0~~7， 那 么 走 到 数据 库 1 去 ， 
如 果 是 8~f， 则 走 到 数据 库 2 去 。 同 时 ， 也 允许 用 户 直 接 给 定数 据 库 的 
名 字 来 访问 数据 库 。 

这 应 该 是 最 早 的 数据 层 原型 。 

TDDL 1.0 时 代 

后 来 ， 大 家 逐渐 发 现 ， 如 果 按 照 业 务 的 发 展 规模 和 速度 ， 那 么 使 
用 高 端 存 储 和 小 型 机 的 Oracle 存 储 的 成 本 将 难以 控制 ， 于 是 降低 成 本 就 


成 了 必然 。 

如 何 能 够 在 不 影响 业务 正常 发 展 的 前 提 下 ， 从 一 定 程度 上 解决 成 
本 的 问题 呢 ? 

“对 一 部 分 数据 库 使 用 MySQL”，DBA 们 的 决策 是 这 样 ， 于 是 ， 分 
布 式 数 据 层 的 重担 就 落 到 了 华 黎 的 头 上 。 

别 看 现在 数据 水 平 切 分 似乎 已 经 成 了 基础 知识 。 在 2007 年 、2008 
年 ， 如 何 设计 它 还 真是 让 我 们 伤 透 了 脑筋 。 

当时 的 我 们 ， 只 知道 eBay 有 一 个 数据 层 ， 却 不 知道 如 何 设计 和 实 
现 ? 

于 是 邀请 了 当时 所 有 的 业务 负责 人 来 畅想 数据 层 的 样子 .…… 得 至 
了 以 下 需求 : 

e 对 外 统一 一 切 数据 访问 ; 

e 支 持 缓 存 、 文 件 存储 系统 ; 

e 能 够 在 Oracle 和 MySQL 之 间 自 由 切换 ; 

e 支 持 搜 索引 掌 。 

然后 ， 我 们 自己 的 问题 与 现在 大 家 所 问 的 问题 也 是 完全 一 样 的 。 

如 何 实现 分 布 式 Join (连接 ) ? 一 一 在 跨 节 点 以 后 ， 和 简单 的 Join 会 
变 成 MxN 台 机 器 的 合并 ， 这 个 代价 比 原来 的 基于 数据 库 的 单机 Join 大 太 
多 了 。 

如 何 实现 高 速 多 维度 查询 ? 一 一 就 像 SNS 中 的 消息 系统 ，A 发 给 B 
一 个 消息 ， 那 么 A 要 看 到 的 是 我 发 给 所 有 人 的 消息 ， 而 B 要 看 到 的 是 所 
有 人 发 给 我 的 消息 。 这 种 多 维度 查询 ， 如 何 能 够 做 到 高 效 快捷 呢 ? 

如 何 实现 分 布 式 事务 ? 一 一 原始 单机 数据 库 中 存在 着 大 量 的 事务 
操作 ， 在 分 布 式 以 后 ， 分 布 式 事务 的 代价 远 远 大 于 单机 事务 ， 那 么 这 
个 矛盾 也 变 得 非常 明显 。 

华 黎 带 着 我 和 念 冰 ， 坐 在 那里 讨论 了 一 个 半月 ， 还 是 没 想 出 
> 于 是 决定 先 动 起 手 来 。 名 字 是 我 起 的 Taobao Distributed Data 
layer (TDDL， 后 来 有 人 对 它 取 了 个 外 号 :“ 头 都 大 了 ”©__Ob) 

学 习 开源 的 Amoeba Proxy。 


| 


找到 的 目标 应 用 是 “收藏 来 "， 首 先 要 做 的 两 个 关键 的 特性 是 : 分 
库 分 表 和 异 构 数据 库 的 数据 复制 。 

开始 本 来 希望 和 B2B 的 团队 合作 ， 因 为 我 们 觉得 独立 的 Proxy 没 有 
太 大 必要 。 而 SQL 解 析 器 因为 有 淘宝 特殊 的 需求 ， 所 以 也 需要 重 写 。 

可 惜 ， 最 后 因为 B2B 的 人 搬 到 滨江 去 了 ， 交 流 十 分 不 畅 ， 所 以 最 后 
只 是 做 了 拿 来 主义 ， 没 有 对 开源 的 Amoeba 和 当时 的 Cobar 有 所 贡献 。 

回 到 淘宝 ， 因 为 有 东西 可 以 借鉴 ， 我 们 在 一 个 多 月 的 时 间 内 就 完 
成 了 TDDL 1.0 版 本 的 工作 。 上 线 过 程 中 里 然 出 了 点 小 问题 ， 不 过 总 体 
来 说 是 比较 成 功 的 。 

TDDL 2.0 时 代 

随 着 使 用 TDDL 的 业务 越 来 越 多 ， 对 业务 方 来 说 ，DBA 对 于 使 用 
MySQL 以 及 数据 切 分 也 积累 了 比较 多 的 经 验 ， 于 是 决定 开始 动 核心 应 
用 了 。 

“评价 ”是 第 一 个 重要 的 应 用 ， 评 价 最 重要 的 问题 还 是 在 于 双向 查 
询 、 评 价 、 被 评价 。 于 是 我 们 的 异 构 数据 源 增 量 复制 就 派 上 了 用 场 。 

然后 是 “商品 ”>， 我 们 在 商品 上 投入 了 近 半 年 的 时 间 ， 失 败 很 多 ， 
也 成 长 得 最 快 。 

e 容 量规 划 做 得 不 到 位 ， 机 器 到 位 后 因 压力 过 大 ， 直 接 死 掉 ， 于 是 
产生 了 数据 库容 量 线 上 压力 模拟 测试 。 

e 历 史 遗 留 问 题 ， 商 品 几 乎 是 所 有 的 业务 都 会 使 用 的 资源 ， 所 以 接 
口 设计 比较 复杂 。 很 多 接口 的 调用 在 新 架构 上 很 难以 低 成 本 的 方式 实 
现 。 而 推动 业务 改动 ， 则 需要 大 量 的 时 间 和 成 本 。 

e 数 据 层 代码 被 业务 代码 侵 染 ， 看 起 来 似乎 应 该 是 数据 层 的 代码 ， 
但 实际 上 又 只 有 商品 在 使 用 。 这 种 问题 让 数据 层 的 依赖 变 得 更 加 庞 
大 ， 边 缘 代 码 变 得 更 多 ， 冲 突 更 明显 。 

TDDL 3.0~TDDL 4.0 时 代 

在 商品 之 后 ， 似 乎 所 有 的 应 用 都 可 以 使 用 类 似 的 方式 来 解决 业务 
增长 上 量 的 问题 。 但 正当 我 们 志 得 意 满 的 时 候 ， 却 被 < 交易” 撞 了 一 个 
满怀 。 

我 一 直 很 感谢 交易 线 的 所 有 同仁 ， 他 们 是 淘宝 草根 精神 的 典型 代 
表 一 -一 功能 可 以 做 得 不 那么 “漂亮 ”， 但 必须 减少 中 间 环 节 ， 真 正 做 到 


了 实用 、 干 净 、 和 简洁。 我 们 在 向 他 们 介绍 产品 的 时 候 ， 他 们 对 我 们 的 
实现 细节 提出 了 非常 多 的 质疑 ， 他 们 认为 整个 流程 中 只 有 规则 、 主 备 
切换 对 他 们 是 有 意义 的 ， 而 解析 、 合 并 则 是 他 们 所 不 需要 的 功能 。 

“不 需要 的 功能 为 什么 要 放 到 流程 里 ? 增加 的 复杂 度 会 导致 更 多 的 
问题 ”。 在 当时 ， 我 感到 很 痛苦 ， 因 为 我 无 法 回答 他 们 这 些 质疑 之 声 。 

不 过 ， 也 正 是 因为 这 些 质疑 ， 让 我 有 了 一 个 契机 ， 重 新 审视 自己 
所 创造 出 来 的 产品 。 

我 问 自己 : 它 能 够 给 业务 带 来 什么 益处 ? 

对 此 ， 我 的 回答 是 : 

e 规 则 引擎 / 切 分 规则 可 以 用 配置 的 方式 帮助 业务 隔离 具体 的 数据 库 
地 址 与 用 户 的 业务 逻辑 ; 

e 单 机 主 备 切换 ; 

e 数 据 源 简化 和 管理 。 

于 是 ， 我 们 就 产生 了 TDDL 3.0 版 本 。 其 主要 的 作用 就 是 将 代码 做 
了 逻辑 切 分 ， 将 单机 主 备 切 换 和 数据 源 管理 独立 了 出来。 这样， 可 以 
针对 不 同 的 业务 需求 ， 给 予 不 同 的 逻辑 分 层 。 让 每 一 个 业务 都 有 适合 
自己 的 使 用 数据 库 的 方式 。 

同时 ， 我 们 开始 做 工具 ，RtoolsJADE 作 为 数据 库 运 维 平台 的 组 件 
被 担 了 出 来 。 在 它 的 帮助 下 ， 我 们 发 现 能 够 极 大 地 提升 用 户 在 使 用 单 
机 数据 源 和 多 机 数据 源 时 的 效率 。 用 户 只 需要 在 客户 端 给 定 两 个 属 
性 ， 就 可 以 立刻 开始 使 用 。 结 果 是 用 户 反 馈 比 以 前 好 了 很 多 。 

这 也 坚定 了 我 们 开发 工具 的 决心 。 

工具 平台 时 代 

征 尝 到 工具 平台 的 甜头 以 后 ， 我 们 在 工具 组 件 上 走 得 更 远 了 。 

首先 被 提出 的 是 “ 蚌 公 ”数据 迁移 平台 。 该 平台 能 够 在 多 种 异 构 的 
数据 库 中 进行 数据 的 平滑 移动 ， 对 业务 影响 很 小 ， 并 且 也 允许 业务 插 
入 自己 的 业务 逻辑 。 

这 个 东西 主要 能 够 帮助 业务 进行 数据 库 自动 扩容 ， 自 动 缩 容 ， 单 
机 、 多 机 数据 迁移 ， 在 Oracle 到 MySQL 数 据 迁 移 等 场景 中 都 发 挥 了 重 
要 的 作用 。 


然后 ， 又 以 内 部 开源 的 方式 提出 了 “ 精 卫 ”数据 增 量 复制 平台 。 这 
个 平台 基于 数据 库 的 通用 数据 分 发 组 件 ， 基 于 开源 的 Tungsten 进 行 了 大 
量 Bug Fix 和 结构 调 优 。 在 数据 的 一 对 多 分 发 以 及 异步 通知 给 DW 和 搜 
索 等 场景 中 都 发 挥 了 重要 的 作用 。 

TDDL 的 现在 

粗略 统计 下 来 ，TDDL 已 经 走 过 了 4 年 的 时 间 ， 满 足 了 近 700 个 业务 
应 用 的 使 用 需求 。 其 中 有 交易 商品 评价 用 户 等 核心 数据 ， 也 有 不 那么 
有 名 的 中 小 型 应 用 。 量 变 产生 质变 ， 如 何 能 够 更 好 地 帮助 这 些 业 务 以 
更 低 的 成 本 更 快 地 完成 业务 需求 ， 将 成 为 数据 层 未 来 最 重要 的 挑战 。 


Session 框 架 


介绍 Session 框 架 之 前 ， 有 必要 先 了 解 一 下 Session。Session 在 网 络 
应 用 中 称 为 “会 话 *"， 借 助 它 可 提供 客户 端 与 服务 系统 之 间 必 要 的 交 
互 。 因 为 HTTP 协 议 本 身 是 无 状态 的 ， 所 以 经 常 需要 通过 Session 来 解决 
服务 端 和 浏览 器 的 保持 状态 的 解决 方案 。 用 户 向 服务 器 发 送 第 一 个 请 
求 时 ， 服 务 器 为 其 建立 一 个 Session ， 并 为 此 Session 创 建 一 个 标识 ， 用 
户 随 后 的 所 有 请 求 都 应 包括 这 个 标识 号 。 服 务 器 会 校对 这 个 标识 号 以 
判断 请 求 属于 哪个 Session。 会 话 保持 有 效 ， 默 认 状 况 下 ， 直 到 浏览 
关闭 ， 会 话 才 结束 。 

Session 中 存储 的 内 容 包 括 用 户 信息 : 昵称、 用 户 ID、 登 录 状 态 
< 

当 网 站 服务 器 只 有 一 台 的 时 候 ， 用 Session 来 解决 用 户 识 别 是 很 简 
单 的 ， 但 是 当 网 站 是 一 个 集群 的 时 候 ， 同 一 用 户 的 两 次 请 求 可 能 被 分 
配 到 两 台 不 同 的 服务 器 上 处 理 。 怎 样 保证 两 次 请 求 中 存 取 的 Session 值 
一 致 呢 ? 还 有 一 个 问题 : 网 站 规模 扩大 时 ， 对 于 一 个 具有 上 亿 个 访问 
用 户 的 系统 来 说 ， 当 大 部 分 用 户 的 Session 信 息 都 存储 在 服务 端 时 ， 要 
在 服务 端 检索 出 用 户 的 信息 效率 就 非常 低 了 ，Session 管 理 器 不 管用 什 
么 数据 结构 和 算法 都 要 耗费 大 量 内 存 和 CPU 时 间 。 如 何 解决 服务 端 
Session 信 息 的 管理 ? 

解决 集群 Session 共 享 的 问题 ， 通 党 有 以 下 两 种 办 法 。 

e 人 硬件 负载 ， 将 用 户 请 求 分 发 到 特定 的 服务 器 。 


eSession 复 制 ， 就 是 将 用 户 的 Session 复 制 到 集群 内 所 有 的 服务 器 。 

这 两 种 方法 的 弊端 也 很 明显 : 

e 成 本 较 高 。 

e 性 能 差 。 当 访问 量 增 大 的 时 候 ， 带 宽 增 大 ， 而 且 随 着 机 器 数量 的 
增加 ， 网 络 负担 成 指数 级 上 升 ， 不 具备 高 度 可 扩展 性 ， 性 能 随 着 服务 
器 数量 的 增加 急剧 下 降 ， 而 且 容 易 引 起 广播 风暴 。 

这 种 情况 下 ，Tbsession 框 架 内 亮 登 场 了 。Tbsession 框 架 致力 于 解 
决 以 下 几 个 问题 。 


SEE 架 


Configclient configServer 


Tairclient TairServer 


eSession 的 客户 端 存储 ， 将 Session 信 息 存 储 到 客户 端 浏览 器 Cookie 
中 。 

e 实 现 服务 端 存储 ， 减 少 Cookie 人 使用， 增强 用 户 信息 的 安全 性 ， 避 
免 浏 览 器 对 Cookie 数 量 和 大 小 的 限制 。 

eSession 配 置 统 一 管理 起 来 ， 集 中 管理 服务 端 Session 和 客户 端 
Cookie 的 使 用 情况 ， 对 Cookie 的 使 用 做 有 效 的 监管 。 

e@ 支 持 动态 更 新 ，Session 的 配置 动态 更 新 。 

简单 地 说 ， 就 是 要 么 用 客户 端 Cookie 来 解决 问题 ， 要 不 用 服务 端 
的 集中 缓存 区 (Tair) 的 Session 来 解决 登录 问题 。Tair 已 在 前 文 介绍 
过 ，Session 对 它 的 使 用 就 不 再 描述 了 。 


为 什么 这 里 还 要 提 到 用 Cookie 这 种 比较 “落伍 ”的 方式 呢 ? 其 实 是 基 
为 在 淘宝 3.0 版 本 以 前 ， 我 们 一 直 都 用 Cookie 来 识别 用 户 ，Cookie 是 放 
在 客户 端的 ， 每 一 次 HTTP 请 求 都 要 提交 到 服务 端 ， 在 访问 量 比较 小 的 
时 候 ， 采 用 Cookie 避 免 了 Session 复 制 、 硬 件 负载 等 高 成 本 的 情况 。 但 
随 着 用 户 访问 规模 的 提高 ， 我 们 可 以 折算 一 下 ， 一 个 Cookie 大 概 是 2KB 
的 数据 ， 也 就 是 说 ， 一 次 请 求 要 提交 到 服务 器 的 数据 是 网 页 请 求 数 

据 ， 再 加 上 2KB 的 Cookie， 当 有 上 亿 个 请 求 的 时 候 ，Cookie 所 带 来 的 流 
量 已 经 非常 可 观 了 ， 而 且 网 络 流量 的 成 本 也 越 来 越 高 。 于 是 在 3.0 版 本 
中 ， 我 们 采用 了 集中 式 的 缓存 区 的 Session 方 式 。 

到 此 为 止 ， 应 用 服务 切 分 了 (TM、IM) 、 核 心服 务 切 分 了 
(TC、IC) 、 基 础 服务 切 分 了 (UIC、Forest) 、 数 据 存 储 切 分 了 
(DB、TFS、Tair) ， 通 过 高 性 能 服务 框架 (HSF) 、 分 布 式 数据 层 
(TDDL) 、 消 息 中 间 件 (Notify) 和 Session 框 架 支 持 了 这 些 切 分 。 一 
个 美好 的 时 代 到 来 了 ， 高 度 稳定 、 可 扩展 、 低 成 本 、 快 速 迭代 、 产 品 
化 管理 ， 淘 宝 的 3.0 系 统 走 上 了 历史 的 舞台 。 

在 这 个 分 布 式 系统 的 支持 下 ， 更 多 的 业务 迅速 开发 出 来 了 ， 因 为 
任何 一 个 业务 都 基于 淘宝 的 商品 、 交 易 、 会 员 、 评 价 等 基础 体系 ， 而 
这 些 基 础 体系 就 像 “ 云 "一样 存在 ， 现 在 可 以 随处 调用 了 。Hitao、 淘 花 
网 、 民 无 限 、 天 猫 、 一 淘 、 聚 划算 、 各 种 SNS、 各 种 移动 客户 端 等 如 雨 
后 春笋 般 地 成 长 起 来 了 。 目 前 ， 淘 宝 已 经 变 成 了 一 个 生态 体系 ， 包 含 
C2C、B2C、 导 购 、 团 购 、 社 区 等 各 种 电子 商务 相关 的 业务 。 

既然 说 是 一 种 “生态 体系 ”， 那 就 不 能 把 所 有 的 业务 把 控 在 自己 的 
手中 ， 在 开发 3.0 版 本 的 过 程 中 ， 我 们 就 有 一 个 团队 把 淘宝 “开放 ”出 去 
了 ， 我 们 把 自己 的 数据 、 自 己 的 应 用 通过 接口 的 方式 让 更 多 的 开发 者 
调用 ， 他 们 可 以 开发 出 形形色色 的 产品 ， 例 如 ， 你 可 以 开发 出 心 形 的 
淘宝 店铺 、 萎 形 的 店铺 ， 再 放 到 淘宝 上 供 商 家 购买 。 淘 宝 册 多 的 员 
工 ， 其 创造 力也 是 有 限 的 ， 而 开放 出 去 之 后 ， 让 无 限 的 人 都 可 以 参与 
到 这 个 生态 体系 的 建设 中 来 ， 这 个 生态 体系 才 是 完整 的 。 下 面 就 是 开 
放 平 台 的 架构 师 放 翁 所 记述 的 “开放 平台 这 几 年 ?1 注 1。 


开放 平台 


2006 年 年 底 : 阿里 巴巴 提出 了 Work at Alibaba 的 战略 ， 二 十 多 个 人 
就 被 拉 到 湖畔 花园 马云 的 公寓 里 开始 一 个 叫 阿 里 软件 的 公司 创业 。 当 
时 对 于 Work at Alibaba 有 一 个 滕 腊 胱 胱 的 感觉 ， 就 是 要 为 中 小 企业 提供 
一 个 工作 平台 ， 但 是 工作 平台 又 需要 是 一 个 开放 的 平台 ， 因 为 卖家 的 
需求 是 长 尾 的 ， 当 时 火热 的 Salesforce 给 了 阿里 人 一 些 启示 ， 那 就 是 做 
一 个 支持 二 次 开发 的 工作 平台 ， 半 开放 式 地 满足 各 种 卖家 的 长 尾 管 理 
需求 。 此 时 ， 软 件 市 场 上 就 开始 培养 起 最 早 的 一 批 TP (淘宝 开放 合作 
伙伴 ) 。 迄 今 为 止 ， 很 多 非常 成 功 的 TP 就 是 从 那个 时 候 开 始 进 入 淘宝 
卖家 市 场 的 。 

但 经 过 一 年 的 平台 建设 ,发现 开 发 者 非常 难 利用 平台 做 二 次 开 
， 只 有 阿里 软件 公司 内 部 的 团队 构建 了 三 个 不 同 的 CRM 软 件 。 这 时 
候 淘宝 来 了 一 个 业界 的 技术 牛人 王 文 彬 ( 花 名 : 菲 青 ) ， 这 位 淘宝 新 
晋 的 首席 架构 师 找 到 阿里 软件 的 平台 架构 团队 ， 谈 到 了 当时 业界 还 非 
常 新 颖 的 一 种 技术 平台 一 一 开放 平台 。 由 于 阿里 软件 已 经 在 做 类 似 的 
开放 工作 ， 和 希望 能 够 以 合作 的 方式 来 试 水 开放 平台 。 当 时 双方 都 是 一 
种 尝试 的 态度 ， 因 此 ， 最 后 就 定投 入 一 个 人 花 两 周 时 间 ， 看 是 否 能 够 
做 出 原型 ， 如 果 可 以 ， 就 继续 做 ， 如 果 出 不 了 原型 ， 就 此 结束 。 两 周 
时 间 里 ， 负 责 阿 里 软件 的 架构 师 放 丛 参看 着 美国 雅虎 的 开放 模式 就 搞 
出 了 开放 平台 的 第 一 个 锥 形 ， 没 想到 就 这 样 开 启 了 5 年 的 开放 之 路 。 后 
面 会 根据 时 间 轴 来 说 一 下 开放 平台 的 产品 和 技术 的 变革 ， 每 一 年 会 发 
生 很 多 事情 ， 但 是 调 出 的 一 点 一 滴 是 当年 最 有 感触 的 。 

2007 年 : 萌芽 。SOA 盛 行 的 年 代 ， 内 部 架构 服务 化 成 为 开放 的 第 
一 步 ， 内 部 服务 不 做 好 隔离 ， 开 放 就 意味 着 风险 不 可 控 。 支 付 宝 今 天 
的 服务 框架 SOFA (类 ESB) 、 淘 宝 的 HSF (OSGI) 、 阿 里 软件 的 ASF 
(SCA) 都 是 那个 年 代 的 产物 ， 但 服务 化 带 来 的 痛 却 是 一 样 的 ， 不 论 
是 OSGI 还 是 SCA 之 类 的 服务 框架 ， 本 身 的 服务 化 规约 设计 者 类似， 但 
难题 也 都 摆 在 每 个 架构 师 和 开发 者 面前 : 服务 单元 Bundle 的 粒度 控 
制 ， 服 务 之 间 依 赖 管理 ， 性 能 与 规范 的 冲突 ， 调 试 与 隔离 的 平衡 。 这 
些 都 使 得 一 线 开 发 者 和 平台 框架 实现 者 出 现 非 常 多 的 矛盾 ， 而 这 个 过 
呈 能 活 下 来 的 框架 最 后 都 是 据 弃 了 很 多 企业 级 的 设计 思路 ， 因 为 SOA 
架构 从 企业 级 产品 演变 而 来 ， 而 服务 化 后 的 内 部 平台 要 面 对 的 开放 平 
台 天 生 就 是 互联 网 的 产物 。 


2008 年 : 雏形 。2008 年 年 底 ， 平台 开放 淘宝 服务 30 个 ， 每 天 调用 
量 2000 次 ， 这 一 年 开放 平台 的 开发 者 面向 的 客户 主要 是 阿里 巴巴 上 的 
中 小 企业 和 淘宝 C 店 卖家 。 开 放 平 台 建 设 初 期 要 解决 的 就 是 三 个 问题 : 

e 服 务 路 由 。 (外 部 可 以 获取 内 部 信息 ) 

e 服 务 接口 标准 化 。 (统一 方式 的 获得 各 种 标准 化 信息 ) 

e 授 权 。 (外 部 合法 的 获取 内 部 信息 ) 

服务 路 由 其 实 就 是 写 一 个 高 效 的 HttpAgent， 服 务 接口 标准 化 就 是 
对 象 文 本 化 (JSON，XML) 。 今 天 在 各 大 开放 平台 广 为 使 用 的 OAuth 
协议 ， 当 前 处 于 0.6 版 本 ， 没 有 任何 实际 的 互联 网 开放 平台 使 用 ， 直 到 
Google 于 2008 年 年 底 慢 慢 地 对 外 推广 开放 的 时 候 ，OAuth 被 封装 到 
Google 的 Open SDK 中 ， 才 使 得 很 多 中 小 型 互联 网 公司 使 用 这 种 看 似 复 
杂 的 两 阶段 授权 交互 模式 。 淘 宝 初期 采用 的 是 自 有 协议 ， 因 为 OAuth2 
以 前 的 逻辑 较 复 杂 且 使 用 不 方便 ， 直 到 2011 年 才 开 始 支 持 OAuth2 ， 同 
时 做 了 部 分 的 安全 增强 。 授 权 解 决 了 开放 最 大 的 一 个 问题 : 用 户 安 全 
的 对 应 用 访问 其 数据 受信 。 用 户 从 此 不 用 赤裸 裸 地 将 用 户 名 和 密码 交 
给 一 个 应 用 软件 ， 应 用 也 可 以 在 允许 的 范围 内 (操作 、 数 据 、 授 权时 
长 ) 充分 利用 用 户 授权 来 玩 转 创意 。 


Jser 


有 了 上 面 的 三 板 件 〈 路 由 、 数 据 规 范 和 授权 ) ， 开 放 平 台 正 式 开 
门 迎 客 了 ， 没 有 对 外 做 任何 的 推广 ,日 均 调用 数据 就 猛 增 到 了 1000 
次 ， 此 时 两 个 互联 网 的 新 兴 技 术 Memcached 和 Hadoop 开 始 在 开放 平台 
中 尝试 。 今 天 看 来 ， 这 两 个 技术 已 经 被 大 规模 地 使 用 ，Memcached 无 
疑 是 最 好 的 选择 ， 但 当时 号 称 分 布 式 缓存 的 Memcached 其 实 是 集中 式 
缓存 的 一 种 ， 真 正 的 分 布 式 缓存 还 都 在 纠结 于 一 致 性 和 效率 的 问题 

(第 2、3 阶 段 提 交 ) 。 此 时 需要 有 一 种 方式 能 够 保证 效率 (可 扩展 ) 


和 稳定 性 ， 于 是 我 们 封装 了 Memcached 客 户 端 ， 提 升 当 时 BIO 的 Java 客 
户 端的 性 能 ， 同 时 引入 了 客户 端 负载 均衡 和 容 灾 的 设计 ， 这 种 设计 已 
经 被 应 用 在 现在 很 多 大 型 分 布 式 系统 中 。 另 一 方面 ， 每 天 上 千 万 的 访 
问 也 让 技术 和 产品 对 访问 的 行为 有 很 强 的 分 析 需 求 ， 此 时 ，Hadoop 在 
雅虎 的 充分 利用 引起 了 我 们 的 重视 (当时 的 雅虎 技术 创新 一 直 都 是 业 
界 的 领头 人 ) ， 通 过 仅 有 的 两 台 机 器 和 一 堆 技 术 文档 ， 我 们 摸索 着 搭 
建 了 公司 内 部 的 第 一 个 Hadoop 集 群 ， 而 所 写 的 Hadoop 入 门 实践 也 成 为 
当时 Hadoop 入 门 的 基础 文档 ， 对 于 每 天 2000 次 调用 量 的 日 志 分 析 需 求 
来 说 ，Hadoop 用 得 游 轧 有余， 但 随 着 业务 的 不 断 发 展 ，Hadoop 离 线 分 
析 所 带 来 的 问题 也 凸显 出 来 ，MR 程 序 面 对 灵 活 多 变 的 分 析 需 求 ， 显 得 
不 易 维 护 且 效 率 低下 (数据 反复 读 取 分 析 ) ， 于 是 我 们 也 开始 思考 怎 
样 改进 这 个 新 玩意 儿 。 

2009 年 : 产品 化 。 到 2009 年 年 底 ， 平台 开 放 淘 宝 服 务 100 多 个 ， 每 
天 调用 量 为 4000 次 ， 这 一 年 开放 平台 的 开发 者 面 对 的 主要 是 淘宝 C 店 卖 
家 ， 卖 家 工具 成 为 服务 市 场 的 主流 。 这 一 年 也 是 变化 的 一 年 ， 阿 里 软 
件 年 中 的 分 拆 使 得 开放 平台 的 归属 有 些微 妙 ， 一 种 情况 是 留 在 阿里 
云 ， 作 为 集团 的 基础 设施 ， 另 一 种 情况 就 是 跟着 主要 的 业务 需求 方 淘 
宝 走 ， 最 后 我 们 还 是 说 服 了 博士 ， 结 束 了 阿里 软件 的 老 平台 ， 淘 宝 正 
式 开始 自己 的 开放 之 路 。 来 到 淘宝 后 ， 业 务 开放 迅猛 增长 ， 从 30 个 API 
猛 增 到 了 100 个 API， 没 有 对 外 做 任何 业务 推广 ， 平台 调用 量 到 了 年 底 
翻番 。 此 时 技术 上 的 挑战 又 聚焦 到 了 性 能 上 ， 一 次 API Call 的 业务 消耗 
平均 在 30 人 40ms， 开 放 平 台 当 时 的 平台 处 理 消耗 平均 在 10ms 左 右 。 我 
们 做 了 数据 打点 和 分 析 ， 发 现 最 大 的 消耗 在 于 互联 网 数据 的 接收 ， 同 
时 大 量 的 图 片 数 据 上 行 ， 更 是 加 大 了 平台 处 理 时 间 。 另 外 ， 从 访问 日 
志 分 析 中 可 以 看 到 很 多 无 效 的 请 求 也 占用 了 非常 多 的 处 理 时 间 ， 这 也 
意味 着 无 效 请 求 和 和 有效 请 求 一 样 在 消耗 着 有 限 的 容器 线程 资源 。 于 是 
我 们 开始 尝试 自己 封装 字 节 流 解 析 模 块 ， 按 需 解析 上 行 数据 ， 一 来 可 
以 提升 数据 分 析 的 性 能 (并行 业务 和 数据 增 量 分 析 操 作 ) ， 二 来 可 以 
用 最 小 代价 处 理 异常 请 求 ( 当 发 现 不 满足 业务 规范 时 ， 则 立刻 丢弃 后 
续 所 有 的 数据 ) ， 这 块 实现 被 叫做 LazyParser， 主 要 的 实现 重点 就 是 最 
小 化 数据 缓存 来 进行 并 行业 务 和 数据 解析 操作 ， 上 线 后 效果 不 错 ， 整 
个 系统 平均 处 理 时 间 从 10ms 降 低 到 了 4ms。 (包含 了 异常 处 理 的 优化 和 
解析 性 能 的 提升 ) 


另 一 方面 ，Hadoop 的 MR 问 题 也 日 益 突出 ， 一 大 堆 MR 的 Class 
(类 ) 维护 成 本 高 、 性 能 问题 也 随 之 出 现 。 此 时 我 们 开始 尝试 抽象 分 
析 业 务 场景 ， 想 到 的 是 是 否 能 够 通过 配置 就 可 以 完成 各 种 统计 分 析 需 
求 。 要 用 配置 替代 代码 ， 其 实 就 看 是 否 可 以 穷 举 代码 所 实现 的 各 种 统 
计 需 求 。 当 回顾 SQL 的 理念 时 ， 发 现 其 实 所 有 的 统计 在 切割 成 为 KV 作 
为 输入 /输出 时 ， 所 涵盖 的 需求 无 非 是 Max、Min、Average、Sum、 
Count 、 Distinct (这 个 是 2012 年 实现 的 ， 用 了 bloomfilter 和 
AtomicLong) ， 再 复杂 一 些 无 非 就 是 上 述 几 个 操作 结果 的 数学 表达 式 
运算 。 因 此 ，KV 输 入 和 KV 输出 的 离散 统计 配置 需求 已 经 抽象 出 来 
了 ， 接 着 就 是 把 统计 完 的 一 组 组 KV 根据 K 来 做 Groupby (分 组 ) ， 就 生 
成 了 传统 意义 上 的 报表 (K，v1，v2...) 。 从 此 以 后 ， 每 天 的 统计 需求 
都 通过 配置 来 改变 ， 再 也 没有 一 大 堆 MR 人 代码， 同时 一 次 数据 输入 就 可 
以 完成 所 有 分 析 的 处 理 ， 性 能 上 得 到 了 极 大 的 提高 。 

虽然 Hadoop 每 日 分 析 抽 象 出 模型 配置 解决 了 性 能 和 易 用 性 的 问 
题 ， 但 是 对 于 即时 分 析 却 不 太 适 合 ， 当 时 出 于 监控 的 需求 ， 和 希望 能 够 
一 个 小 时 就 可 以 对 数据 做 一 次 增 量 的 分 析 ， 用 于 监控 服务 整体 的 调用 
情况 ， 保 证 对 异常 问题 的 即时 排查 。 由 于 一 天 4000 次 的 调用 量 还 不 算 
很 大 ， 因 此 ， 当 时 就 直接 考虑 采用 MySQL 分 库 分 表 的 方式 ， 然 后 定时 
做 SQL 的 查询 ， 结 果 发 现 效 果 不 错 。 当 然 ， 这 个 过 程 又 产生 了 一 个 小 
组 件 ， 要 直到 4000 次 的 日 志 数 据 写 磁盘 和 DB 双 份 必然 会 带 来 不 少 的 IO 
消耗 ， 同 时 这 个 系统 并 不 是 账 务 系统 ， 丢 掉 一 点 日 志 也 没关系 。 
此 ， 就 采取 了 异步 批量 数据 外 写 的 设计 (多 线程 守护 各 自 的 一 块 Buffer 
页 ， 定 时 外 刷 或 者 满 页 外 刷 ) ， 这 样 在 双 写 的 情况 下 ， 单 机 的 Load 也 
没有 超过 0.7。 

但 快 到 年 底 的 时 候 ， 发 生 了 一 件 事 情 让 我 们 头痛 不 已 ， 同 时 也 成 
了 开放 平台 的 一 个 “隐形 炸弹 ”。 一 天 晚上 ， 突 然 发 生平 台大 规模 拒绝 
服务 的 告警 ， 观 察 整个 集群 发 现 ， 业 务 处 理 时 间 从 平均 的 30 人 40ms， 
上 升 到 了 1s， 仔 细 观 察 发 现 ， 某 一 个 业务 的 响应 时 间 大 幅 攀 升 ， 从 原 
来 20ms 的 响应 时 间 奖 升 到 了 1s 以 上 ， 此 时 由 于 HTTP 请 求 的 同步 性 ， 导 
致 前 端 服务 路 由 网 关 的 集群 线程 都 释放 得 非常 慢 ， 阻 塞 处 理 这 个 业务 
的 请 求 ， 而 其 他 正常 的 业务 (淘宝 开放 平台 背后 的 服务 由 不 同 的 团队 
维护 ， 处 理 时 间 从 lms 到 200ms 都 有 ) 也 无 法 被 访问 ， 因 此 ， 才 有 了 开 
始 的 全 线 告警 的 产生 。 后 来 发 现 是 这 个 业务 团队 的 一 次 发 布 中 忽略 了 


数据 库 索 引 建 立 导致 服务 耗 时 增加 ， 但 这 个 问题 开始 时 不 时 地 拜访 开 
放 平 台 ， 开 放 平 台 稳 定性 受制 于 任何 一 个 业务 方 ， 这 是 不 可 接受 的 。 
对 于 这 个 问题 ， 起 先 考虑 集群 拆 分 ， 即 将 重要 业务 和 不 重要 业务 拆 
分 ， 但 考虑 到 实施 成 本 〈 不 同 服务 的 利用 率 差异 很 大 ) 和 业务 隔离 是 
否 彻底 (重点 业务 也 会 相互 影响 ) ， 最 终 放弃 了 这 个 想法 。 当 时 又 想 
到 了 软 负载 切割 Haproxy 和 LVS， 一 个 是 七 层 的 网 络 软 负载 切割 ， 一 个 
是 四 层 的 负载 切割 ， 由 于 涉及 业务 ， 于 是 考虑 用 七 层 的 软 负载 切割 ， 
尝试 一 台 Haproxy 挂 7 台 虚 拟 机 ， 然 后 运行 期 可 动态 调整 ， 配 置 在 出 现 
问题 的 时 候 可 人 工 干 预 切割 流量 。 就 这 样 ， 我 们 有 了 告警 以 后 可 以 手 
动 切割 的 半 人 工 方式 干预 措施 。 但 我 们 依然 晚上 睡 不 踏实 .……. (期 间 
考虑 过 Web 请 求 异步 化 和 Servlet3 的 模式 来 规避 同步 HTTP 带 来 的 平台 阻 
塞 ， 但 当时 唯一 支持 Servlet3 的 Jetty 和 Tomcat 做 压力 测试 ， 效 果 都 很 不 
稳定 ) 

2010 年 : 平台 化 。 到 2010 年 年 底 ， 平 台 开 放 淘 宝 服务 300 多 个 ， 每 
天 调用 量 为 8 亿 次 ， 这 一 年 淘宝 正式 开始 对 外 宣传 开放 ， 淘 宝 开放 年 赢 
在 淘宝 ， 目 前 很 多 年 收入 上 千 万 的 TP 在 这 个 时 候 成 了 先锋 (2010 年 以 
前 的 可 以 叫做 先烈 ) ， 产 品 层 面 上 ， 这 一 年 除了 卖家 工具 的 继续 发 
展 ，SNS 热 潮 的 兴起 带动 了 淘 江 湖 的 买 家 应 用 ， 游 戏 应 用 的 淘金 者 蜂 肾 
而 入 ， 开 放 的 服务 也 继续 保持 300% 的 增 速 ， 履 盖 面 从 卖家 类 延伸 到 了 
买 家 类 ， 从 简单 的 API 提 供 ， 到 了 淘宝 网 站 支持 深度 集成 应 用 到 店铺 和 
社区 。 

在 8 亿 次 访问 量 的 情况 下 ， 再 用 MySQL 做 流 式 分 析 已 经 不 可 能 了 ， 
分 析 时 间 要 求 也 从 一 个 小 时 提升 到 了 20 分 钟 ， 此 时 经 过 快 一 年 半 的 
Hadoop 使 用 和 学 习 ， 再 加 上 对 分 布 式 系统 的 了 解 ， 正 式 开始 写 第 一 版 
的 流 式 分 析 系 统 ，MR 的 抽象 依旧 保留 ， 而 底层 的 数据 计算 分 析 改 用 其 
他 方式 ， 这 个 “其 他 方式 ?和 和 Hadoop 的 差异 在 于 : 

e 分 析 任务 数据 来 源 于 远 端 服务 器 日 志 (主要 通过 Pull， 而 非 
Push) 。 

e 任 务 分 配 和 调度 采用 被 动 分 配 (有 点 类 似 于 Volunteer Computing 
的 模式 ) ，Mater 轻 量 的 管理 任务 ，Slave 加 入 即 可 要 求 执行 任务 ， 对 任 
务 执行 的 情况 不 监控 ， 只 简单 通过 超时 来 重 置 任务 状态 。 


e 任 务 统 一 由 Master 来 做 最 后 的 Reduce，Slave 可 以 支持 做 Shuffle 来 
减少 数据 传输 量 和 Master 的 合并 压力 ，Master 负 责 统 一 输出 结果 到 本 
地 。 

总 的 来 说 ， 就 是 数据 来 源 变 了 ， 数 据 不 通过 碰 盘 文件 来 做 节点 计 
算 交 互 (只 在 内 存 使 用 一 次 就 丢掉 了 ) ， 简 化 任务 调度 ， 简 化 数据 归 
并 。 这 样 第 一 版 本 的 流 式 分 析出 来 了 ， 当 然 ， 后 面 这 些 设 计 遇 到 的 挑 
战 让 这 个 项 目 不 断 在 演进 ， 演 进 的 各 种 优化 几 年 后 发 现 都 在 Hadoop 或 
者 Hive 之 类 的 设计 中 有 类 似 的 做 法 。 (参看 Blog， 地 址 为 
http : //blog.csdn.net/cenwenchu79， 根 据 时 间 轴 可 以 看 到 各 种 结构 优化 
和 性 能 优化 的 过 程 ) 这 个 系统 的 三 台 虚 拟 机 撑 住 了 8 亿 次 的 日 志 即 时 分 
析 ，MySQL 日 志 分 析 就 此 结束 。 

这 一 年 另 一 个 重大 改变 就 是 更 多 的 人 对 开放 的 价值 有 所 认同 ， 淘 
宝 从 一 个 部 门 的 开放 走 到 了 淘宝 公司 的 开放 ， 什 么 叫做 部 门 开放 ? 就 
是 在 10 年 以 前 大 部 分 的 API 开 放 都 是 开放 平台 这 个 团队 来 做 封装 维护 ， 
30 个 API 还 可 以 支撑 ，100 个 API 已 经 让 一 个 专业 的 小 团队 应 接 不 暇 〈 当 
然 不 得 不 承认 ， 迄 今 为 止 ， 淘宝 最 有 全 局 业务 知识 的 还 属 这 个 团队 的 
成 员 ) ，300 多 个 API 这 种 势头 基本 上 就 无 法 由 一 个 团队 来 做 了 ， 业 务 
变更 带 来 的 接口 不 稳定 经 常 被 投诉 。 因 此 ， 我 们 启动 了 服务 轻 量 化 的 
“长 征 项 上 目 ”， 逐 渐 通 过 工具 和 平台 将 服务 接 入 变 成 自动 化 的 方式 ， 将 
原来 开放 一 个 服务 需要 点 对 点 ， 手 把 手 花 一 周 时 间 实 施 完成 的 过 程 ， 
通过 自动 化 服务 发 布 平台 ， 一 个 人 一 天 时 间 就 可 以 发 布 一 个 服务 ， 并 
且 服 务 的 文档 中 ， 多 语言 版 本 SDK 都 自动 生成 。 这 样 就 具备 了 服务 轻 
量化 的 基础 ， 然 后 将 各 个 新 开放 的 业务 采用 这 种 模式 接 入 ， 而 老 业 务 
逐渐 归还 给 各 个 业务 方 去 维护 。 这 样 ， 服 务 的 “稳定 性 ”( 业 务 方面 ) 
得 到 了 非常 大 的 提升 ， 用 户 对 于 服务 的 满意 度 也 得 到 了 极 大 的 提高 。 

但 这 个 担子 放下 了 ， 那 个 担子 又 挑 上 了 ， 在 上 面谈 到 后 人 台 应 用 不 
稳定 导致 平台 整体 不 稳定 的 问题 在 轻 量 化 以 后 出 现 的 频率 和 次 数 更 多 
了 ， 因 为 发 布 和 维护 都 落 到 了 后 台 部 门 ， 此 时 对 于 各 个 系统 的 把 控 就 
更 弱 了 ，KPI 中 的 稳定 性 指标 基本 就 没 法 定 了 。 唯 一 能 够 彻底 解决 问题 
的 办 法 就 是 HTTP 服 务 异步 化 + 事件 驱动 + 虚拟 隔离 线程 闻 。2010 年 年 中 
对 Jetty7 做 了 一 次 压 测 ， 发 现 Continuations 的 效果 已 经 可 以 上 正式 的 环 
境 了 ， 于 是 开始 在 Jetty7 的 基础 上 做 HTTP 服 务 异步 化 + 事件 驱动 的 封 


装 ， 同 时 也 实现 了 一 个 虚拟 隔离 线程 池 做 配合 。 具 体 设 计 细 节 这 里 就 
不 再 多 说 ， 参 看 Blog， 简 单 描 述 原 理 如 下 : 
e 将 前 端 容器 线程 和 业务 处 理 隔 离 。 (类 似 NIO 和 BIO 的 设计 差 


异 ) 


e 业 务 处 理 如 果 依 赖 于 外 部 系统 ， 则 采用 事件 驱动 的 方式 来 减少 线 
程 等 待 ， 同 时 提高 线程 占用 资源 的 利用 率 。 (从 这 点 上 说 ， 理 想 和 现 
实 还 是 有 很 多 细节 差异 的 ， 在 实现 的 时 候 必 须根 据 依赖 系统 消耗 时 间 
占 总 时 间 的 比例 看 是 否 需要 事件 驱动 ， 事 件 驱 动 带 来 的 切换 消耗 是 比 
较 大 的 ) 

e 通 过 一 个 大 的 线程 池 虚 拟 设 置 不 同 的 业务 可 消耗 的 最 大 资源 数 ， 
来 充分 共享 资源 在 异常 情况 下 限制 业务 占用 过 多 的 资源 (任务 处 理 开 
始 排队 ， 而 非 无 度 地 占用 资源 ) 。 

这 个 组 件 上 线 以 后 ， 没 过 几 天 就 发 生 了 一 个 典型 的 案例 ， 一 个 业 
务 在 下 午 2 点 开始 响应 时 间 从 10ms 上 升 到 了 40ms， 然 后 继续 上 升 到 
200ms， 当 时 给 这 个 业务 模拟 设置 最 大 的 线程 资源 数 是 20 个 ， 就 发 现 那 
时 候 由 于 RT 时 间 提 升 ， 线 程 资源 释放 得 慢 ，20 个 慢 慢 地 被 消耗 完了 ， 
此 时 这 个 业务 的 队列 开始 从 0 到 100， 再 到 200..…… (当然 ， 防 止 内 存 过 
多 地 被 占用 ， 会 丢弃 超过 队列 长 度 的 业务 处 理 ) ， 而 其 他 业务 还 是 正 
常 地 使 用 着 资源 ， 平 台 平 稳 ， 到 了 下 午 4 点 多 ， 业 务 方 收 到 告警 修复 以 
后 ，RT 时 间 下 降 到 了 10ms， 队 列 中 的 请 求 数 量 开 始 减 少 ， 最 后 队列 清 
空 ， 线 程 资源 占用 下 降 到 正常 水 平 。 

从 此 以 后 ， 震 子 开 心地 和 我 说 : 开放 平台 稳定 性 的 KPI 可 以 随便 大 
胆 地 写 几 个 9 了 。 

2011 年 : 市 场 化 。 到 2011 年 年 底 ， 平 台 开 放 淘 宝 服务 758 个 ， 每 天 
调用 量 19 亿 次 ， 这 一 年 SNS 热 潮 消 退 ， 游 戏 逐 渐 痰 出， 卖家 市 场 依旧 生 
意 火 暴 ， 营 销 工具 窑 圳 头角， 成 为 开发 者 新 宠 ， 淘 宝 客 成 为 开放 新 宠 
(这 一 年 返利 网 和 团购 一 样 火 ， 只 是 前 者 收 钱 ， 后 者 烧 钱 ) 。 

就 在 开放 平台 前 景 一 片 大 好 的 时 候 ， 出 现 了 一 个 让 开放 转变 和 收 
缩 的 导 火 索 ， 一 家 做 营销 工具 的 公司 “团购 宝 ” 每 天 凌晨 都 会 通过 接口 
同步 客户 设置 的 一 些 优惠 商品 信息 到 淘宝 网 ， 结 果 那 天 凌晨 ， 微 博 上 
突然 有 很 多 人 说 某 些 店 都 是 一 块 钱 的 便宜 货 ， 要 知道 这 种 事情 在 微 博 
盛行 的 了 时代， 传播 速度 之 快 ， 影 响 之 大 ， 当 即 很 多 卖家 商品 都 被 1 块 钱 


拍 下 。 最 后 发 现 是 线 下 的 商品 价格 不 知道 怎么 全 被 修改 成 1 块 钱 ， 然 后 
凌晨 一 同步 ， 就 导致 出 现 了 上 面 的 一 幕 。 从 那 时 候 开 始 ， 开 放 平 台 的 
KPI 中 增加 了 一 个 重 中 之 重 的 功能 : 安全 ， 包 括 后 面 的 很 多 技术 产品 都 
围绕 安全 展开 。 此 时 第 一 个 被 波及 提升 能 力 的 系统 就 是 流 式 分 析 集 
群 ，20 分 钟 一 轮 的 数据 分 析 要 求 压 缩 到 3 分 钟 ， 同 时 数据 量 已 经 从 每 天 
8 亿 条 增长 到 了 每 天 19 亿 条 ， 花 了 两 个 月 时 间断 断 续 续 地 优化 集群 结构 
设计 和 单机 处 理 能 力 ， 对 于 其 中 经 历 的 内 容 ， 有 一 天 我 翻 Hadoop 的 优 
化 过 程 时 看 到 了 相似 的 场景 ， 具 体 就 不 在 这 里 费 述 ， 详 细 内 容 可 参考 
Blog。 简 单 地 说 ， 包 括 四 个 方面 : 充分 利用 多 核能 力 用 计算 换 内 存 ; 
磁盘 换 内 存 ， 用 并 行 设计 来 保证 整体 业务 时 间 消 耗 不 变 甚至 减少 ; 
Slave Shuffle 来 减少 Mater 的 合并 压力 ;数据 压缩 减少 数据 传输 消耗 和 内 
存 占用 。 

另 一 方面 ， 由 于 2010 年 对 于 Jetty7 的 充分 理解 和 封装 ， 此 时 看 到 了 
又 一 个 新 技术 的 契机 ，2010 年 去 美国 参加 Javaone， 当 时 看 到 有 老外 用 
Jetty7 的 特性 来 实现 Comet 功 能 ，Comet 原 先 主要 用 于 CS 结构 的 应 用 搬 
到 互联 网 上 ， 因 为 不 能 用 TCP 的 长 连接 ， 所 以 不 得 不 用 HTTP 的 长 连接 
来 替代 原来 的 模式 ， 同 时 国外 开放 平台 也 关注 很 多 新 型 的 API 设 计 ， 其 
中 就 有 Twitter 的 Streaming API， 这 种 通过 HTTP 长 连接 方式 推送 消息 到 
外 部 ISV (独立 软件 开发 商 ) 的 模式 引起 了 我 们 的 注意 。 因 此 ， 我 们 决 
定 将 Jetty7 上 的 封装 近 一 步 升级 ， 支 持 Comet 长 连接 方式 ， 后 端 通过 事 
件 驱 动 的 模式 主动 推送 内 部 消息 给 外 部 ， 避 免 外 部 轮 询 业 务 接口 。 这 
个 设计 最 重要 的 一 点 就 是 如 何 用 最 有 效 且 最 少 的 线程 来 守护 多 个 长 连 
接 ， 支 持 到 后 端 事件 驱动 的 数据 下 行 ， 如 果 给 每 一 个 长 连接 支持 一 个 
数据 推送 守护 线程 ， 即 时 性 自然 最 高 ， 但 代价 就 是 消耗 众多 空置 连接 
的 守护 线程 (详细 内 容 见 Blog) 。 这 种 模式 刚 出 来 的 时 候 ， 从 上 到 下 
都 是 质疑 声 ， 觉 得 太 不 符合 常规 做 法 ， 常 规 做 法 就 是 pull， 认 为 开发 人 
员 无 法 接受 ， 稳 定性 一 定 不 靠 谱 。 经 过 2011 年 的 * 双 十 一 ”， 当 天 几 个 
“尝鲜 ”的 开发 者 用 一 台 PC 就 支持 几 百 万 笔 订单 的 高 速 处 理 ， 就 让 很 多 
人 明白 了 ， 技 术 要 敢 想 ， 代 码 要 敢 写 ， 细 节 要 敢 专 ， 没 什么 不 可 能 。 
也 就 从 这 以 后 ， 多 样 化 服务 TQL、Schedule API、ATS 从 开放 平台 的 土 
二 上 都 长 了 出 来 ， 为 更 多 的 场景 和 更 多 的 终端 提供 了 各 种 解决 方案 和 
创新 实现 。 


2012 年 : 垂直 化 。 这 一 年 到 现在 ， 平 台 开 放 淘 宝 服务 900 多 个 ， 每 
天 调用 量 为 25 亿 次 ， 这 一 年 淘宝 客 由 于 公司 方向 转变 热潮 消退 ， 无 线 
乘势 而 起 ， 新 业务 (机 彩票 、 酒 店 、 理 财 等 ) 、P4P、 数 据 类 服务 都 开 
台 运 营 API， 开 放 和 平台 开发 者 的 客户 群体 也 从 C 店 卖家 增加 到 了 B 的 品 
牌 商 和 渠道 商 等 。 

这 是 一 个 业务 多 变 的 一 年 ， 这 也 是 淘宝 内 部 对 开放 平台 认可 的 新 
阶段 。 第 一 个 阶段 是 放任 不 管 ， 任 由 开放 平台 部 门 开放 和 封装 。 第 二 
阶段 是 由 业务 方 负责 支持 开放 业务 ， 但 开放 后 的 结果 概 不 了 解 ， 也 无 
所 谓 了 解 。 第 三 阶段 就 是 业务 主动 要 开放 ， 开 放 后 开始 运营 服务 ， 培 
养 ISV 市 场 ， 带 动 业 务 的 正 向 发 展 。 

这 一 年 由 于 业务 量 的 增长 以 及 分 析 需 求 到 用 户 纬度 ， 因 此 ， 在 
2011 年 年 底 启 动 了 流 式 分 析 集 群 重 构 升 级 的 项 目 ， 将 新 的 分 析 集 群 项 
目 命名 为 Beatles， 希 望 它 能 够 像 甲壳 虫 一 样 ， 小 虫 吃 树 叶 ， 再 多 都 能 
吃 下 。2011 年 底 到 2012 年 初 ， 用 了 近 两 个 半月 的 时 间 做 了 一 次 完整 的 
重 构 ， 将 那么 多 年 的 补丁 经 验 和 老 代 码 重新 设计 和 实现 ， 并 且 将 Mater 
根据 业务 可 垂直 切 分 ， 最 终 解决 Master 归 并 压力 的 问题 ， 当 然 期 间 的 技 
术 优 化 点 也 不 少 ， 因 为 我 们 的 目标 从 3 分 钟 压缩 到 了 1 分 钟 ， 而 我 们 的 
数据 量 翻番 ， 统 计 纬 度 细 化 到 了 用 户 纬度 。 (意味 着 结果 也 会 很 大 ， 
如 果 不 靠 文件 做 中 转 ， 如 何 来 实现 需要 更 多 的 分 拆 和 协同 设计 ) 

这 一 年 起 了 两 个 比较 创新 的 项 目 : JS SDK 和 无 线 SDK (IOS， 安 
卓 ) ， 这 两 个 SDK 的 出 现在 一 定 程度 上 由 业务 和 安全 两 方面 决定 。 首 
先 ，2011 年 年 底 启动 了 社区 电子 商务 化 的 项 目 ， 也 就 是 现在 所 说 的 轻 
电 商 (XTao) 项 目 ， 将 更 多 的 网 站 和 淘宝 衔接 起 来 ， 此 时 网 站 间 的 融 
合 就 要 求 更 轻便 和 简易 ， 最 成 功 的 案例 就 是 Facebook ， 于 是 2012 年 年 
初 的 时 候 ， 拿 这 FackBook 的 JS SDK 一 阵 看 ， 就 开始 动手 写 了 ， 期 间 很 
高 兴 拉 了 UED 入 伙 ， 这 才 使 得 这 个 JS SDK 变 得 更 加 靠 谱 ， 更 加 专业 。 
同时 有 了 JS SDK， 买 家 的 服务 安全 性 有 所 保证 ， 因 为 原先 的 REST 调 用 
在 授权 以 后 是 无 法 知道 是 用 户 发 起 的 还 是 服务 器 发 起 的 ， 而 JS SDK 从 
一 定 程度 上 还 要 校 验 Cookie 的 有 效 性 ， 可 以 部 分 保证 用 户 的 在 场 和 知 
情 。 而 下 半年 的 无 线 SDK， 就 是 苦 读 一 个 月 的 各 种 文档 ， 然 后 就 开始 
动手 玩 儿 了 ， 由 于 对 Java 语 言 、 动 态 语言 、 脚 本 语言 都 有 比较 多 的 使 
用 ， 因 此 ，Objective-C 语 言 上 手 并 不 是 那么 困难 ， 同 时 没有 涉及 过 多 
的 MVC 的 内 容 ， 做 SDK 基 础 层 的 东西 还 是 比较 得 心 应 手 的 ， 就 这 样 


IOS 的 无 线 SDK 版 本 就 生成 了 ， 此 时 在 开放 平台 的 技术 团队 内 部 正在 执 
行 一 个 叫做 Hack project 的 活动 ， 其 中 一 个 自主 项 目 就 是 安 卓 的 SDK， 
因此 ， 一 个 月 后 ， 安 卓 的 SDK 顺 利 诞生 了 。 这 两 个 无 线 SDK 所 担负 的 
职责 就 是 把 控 无 线 安 全 问题 ， 不 仪 是 淘宝 ， 业 界 其 实 很 多 公司 都 还 没 
理解 无 线 开放 的 风险 到 底 有 多 大 ，OAuth2 基 本 就 无 法 保证 无 线 的 用 户 
安全 ， 因 此 ， 如 何在 SDK 和 服务 端 融入 更 高 级 别 的 安全 设计 ， 成 了 无 
线 SDK 诞 生 的 第 一 个 重要 需求 。 

另 一 方面 ， 开 放 平 台 安全 体系 的 构建 成 为 2012 年 的 重点 ， 从 两 个 
角度 对 安全 做 了 全 方位 的 控制 |。 

第 一 ， 用 户 。 用 户 授 权 更 细 化 了 授权 操作 范围 ( 细 粒 度 到 了 数据 
范畴 ) ， 授 权时 长 。 所 有 的 信息 可 监控 、 归 档 、 快 速 定 位 ， 我 们 内 部 
叫做 Top Ocean， 简 单 说 来 就 是 对 所 有 的 访问 日 志 做 归档 ， 归 档 的 载体 
是 块 状 文件 ， 归 档 时 对 块 状 文件 的 所 有 记录 按照 需求 建立 索引， 然后 
保留 索引 ， 上 传 本 地 文件 到 远 端 分 布 式 文件 系统 备份 。 实 时 的 监控 服 
务 调 用 和 应 用 访问 ， 授 权 异 动 。 

第 二 ， 第 三 方 应 用 。 采 用 监控 集群 对 所 有 ISV 的 服务 器 做 安全 扫 
昔 ， 对 普通 的 web 安全 漏洞 做 扫描 ， 对 应 用 的 可 用 性 和 响应 时 间 做 监 
控 。 同 时 ， 正 式 启 动 * 聚 石塔 ?项 目 ， 提 供 弹性 计算 和 存储 能 力 及 可 靠 
的 安全 网 络 环境 给 ISV， 帮 助 I SV 提供 自 身 应 用 的 安全 性 。 

至 此 为 止 ，5 年 左右 的 技术 历程 已 部 分 展示 在 了 大 家 的 面前 ， 这 些 
只 是 5 年 中 比较 有 代表 性 的 一 部 分 ， 同 时 技术 的 发 展 也 只 是 开放 平台 的 
一 部 分 ， 前 5 年 是 技术 变革 带动 开放 平台 发 展 ， 而 接 下 去 的 5 年 将 会 是 
业务 变革 和 理解 带动 开放 平台 的 阶段 ， 对 业务 的 理解 直接 决定 了 开放 
平台 的 价值 所 在 。 前 面 轻描淡写 地 介绍 了 5 年 来 不 同 开 放 业 务 的 兴衰 ， 
其 实 这 背后 却 有 更 多 耐人寻味 的 故事 ， 而 5 年 后 的 今天 ， 淘 宝 的 格局 
为 : 集 市 (C2C) 、 天 猫 (B2C) 、 一 淘 ( 电 商 搜索 返利 入 口 ) 、 无 
线 、 新 业务 、020 (本 地 生活 ) 、 团 购 平 台 ( 聚 划算 ) ， 这 些 平台 的 
价值 是 什么 ? 如 何 找到 自身 定位 ? 如 何 借助 外 力 发 展 ? 如 何 面 对 流 量 
入 口 的 兴起 、 传 统 互联 网 企业 的 电 商 化 、 电 商 平台 的 竞争 ? 这 些 才 是 
开放 平台 2012 年 及 下 一 个 5 年 的 精彩 所 在 。 


第 6 章 我 在 淘宝 这 八 年 


作为 淘宝 技术 的 亲历 者 ， 我 不 经 意 间 见证 了 一 段 伟大 的 历史 ， 这 
段 历史 ， 从 高 层 看 波澜 壮阔 ， 从 底层 看 妙趣 横生 。 我 不 是 高 层 ， 这 里 
记录 的 是 发 生 在 底层 的 一 些 事 。 

2011 年 12 月 8 日 那天 ， 有 同事 茶 喜 我 ， 我 才 知 道 自己 在 淘宝 已 经 七 
周年 了 。 很 多 人 问 “ 七 年 痒 不 痒 ? ”老实 说 ， 也 曾经 痒 过 ， 但 往往 都 是 
一 痒 而 过 ， 然 后 又 投入 到 水 深 火 热 的 工作 中 去 。 回 家 之 后 就 想 ， 我 在 
这 七 年 到 底 收获 了 什么 ， 且 不 论 成 败 与 否 ， 这 七 年 的 经 历 ， 是 我 人 生 
的 宝贵 财富 。 

第 一 年 (2004 年 一 2005 年 ) 

@ 正 牌 七 公 曾 经 说 过 ， 要 是 写 一 本 淘宝 的 历史 书 ， 一 定 有 很 多 人 
感 兴趣 ， 其 实 我 也 很 想 写 写 这 样 一 本 书 。2004 年 12 月 8 日 入 职 的 时 候 ， 
我 和 @ 袖 子 如 幻 一 起 进来 ， 迎 接 我 的 是 骆 冰 和 黄 党 @ 岳 旭 强 ， 骆 冰 是 百 
阿 的 班主 任 ， 黄 党 是 我 的 师父 。 当 时 还 没有 百 淘 ， 先 参加 了 百 阿 ， 百 
阿 给 我 发 了 一 本 书 叫 《完美 商店 》 ， 介 绍 的 是 eBay 的 故事 ， 看 的 时 候 
我 就 想 什 么 时 候 我 也 写 一 本 关于 淘宝 的 故事 来 。 

我 进 淘宝 非常 偶然 ， 当 时 只 是 看 到 这 个 网 站 做 得 不 错 ， 自 己 也 不 
想 继续 做 对 日 外 包 的 工作 了 ， 就 过 来 面试 了 一 把 。 刚 进 淘宝 的 时 候 ， 
我 被 震撼 了 ， 它 跟 传统 的 企业 非常 不 一 样 ， 到 处 都 是 生机 撮 勃 的 样 
子 ， 还 有 前 台 的 @ 香 香 的 好 朋友 人 笑 得 很 亲切 ， 之 前 见 到 的 公司 前 台 的 
态度 都 是 冷冰冰 的 。@ 武 当 三 丰 给 我 两 张 笔试 题 做 ， 后 来 居然 通过 
了 。 财 神 面试 我 的 时 候 ， 问 我 为 什么 到 这 里 来 ， 我 说 很 欣赏 这 家 企业 
发 展 这 么 快 ， 这 样 的 企业 一 定 有 很 多 高 手 ， 跟 高 手 在 一 起 成 长 一 定 很 
快 。 我 每 说 一 句 ， 他 点 头 “ 嗯 哼 ” 一 下 ， 以 至 于 后 来 我 跟 我 老婆 形容 公 
司 的 CEO 时 ， 她 只 记得 那个 喜欢 “ 嗯 哼 ”? 的 人 。 

来 淘宝 做 的 事情 是 做 Java 开 发 ， 但 是 之 前 我 只 做 过 3 个 月 的 Java 项 
目 ， 连 Eclipse 都 不 熟 (我 来 之 前 恶 补 了 一 下 快捷 键 的 操作 ) 。 一 开始 
做 事 是 在 @ 岳 旭 强 手把手 的 指导 下 做 的 ， 当 时 非常 依赖 旁边 的 几 个 老 
员工 一 一 多 隆 、 正 风 、 进 宝 、 我 行 、 不 同 、 范 画 、 天 川 。 做 的 事情 也 


没有 一 个 成 熟 的 流程 ， 单 单 是 大 家 在 论坛 看 到 有 人 需要 什么 功能 ， 我 
们 问 问 PD 是 不 是 需要 做 ， 然 后 就 写 代 码 ， 提 交 给 测试 人 员 (给 自在 、 
郭 凌 、 宝 驹 ) ， 最 后 就 让 青青 打包 ， 让 剑 英 发 布 。 我 还 很 清楚 地 记得 
做 的 第 一 个 需求 是 ， 有 卖家 说 不 想 把 货 卖 给 信誉 为 一 颗 心 以 下 的 买 
家 ; 有 卖家 不 想 卖 给 某 个 省 市 的 买 家 ， 我 就 给 卖家 一 个 工具 ， 让 其 限 
制 某 些 买 家 不 能 买 。 于 是 我 就 在 发 布 商品 的 流程 和 生成 订单 的 流程 
中 ， 找 到 合适 的 地 方 ， 加 了 几 个 合适 的 参数 ， 写 了 几 段 合适 的 代码 ， 
就 发 布 上 去 了 ， 但 是 这 个 功能 一 直 疫 敢 启用 。 直 到 3 年 之 后 ，2008 年 要 
拆 分 Denali 的 时 候 ， 这 上段 代码 都 在 ， 但 都 没有 发 挥 作用 。 

做 完 第 一 个 需求 后 ， 自 己 写 的 代码 在 系统 上 运行 了 ， 一 下 子 有 了 
言 心 。 当 时 HR 成 立 了 百 淘 的 项 目 ， 我 先 去 百 淘 二 期 学 习 了 几 天 (本 来 
要 我 参加 一 期 的 ， 但 当时 忙 ， 延 迟到 了 二 期 ， 现 在 百 淘 已 经 过 一 百 期 
了 ) ， 回 来 就 投入 到 一 个 更 牛 的 项 目 一 一 支付 宝 。 

支付 宝 一 开始 生存 在 淘宝 系统 上 ， 但 到 2004 年 年 底 的 时 候 ， 老 马 
的 意 眼看 到 了 支付 宝 的 未 来 。 当 时 请 了 Sun 公 司 的 人 把 淘宝 的 第 一 个 
PHP 有 版 本 变 成 了 Java 版 ， 之 后 ， 就 让 他 们 做 独立 的 支付 宝 系 统 。 我 和 天 
川 从 淘宝 派出 来 做 支付 宝 和 淘宝 相关 的 业务 ， 当 时 除了 Sun 公 司 的 人 和 
淘宝 的 人 ， 还 来 了 一 位 标志 性 的 人 物 @fenng， 他 是 这 个 项 目的 DBA， 
记得 他 刚 来 杭州 时 ， 家 里 要 装 宽 遍 ， 运 营 商 服务 不 周到 ， 被 他 宇 了 好 
和 久 。 后 来 2010 年 ) 他 在 微 博 上 大 战 中 国电 信 已 经 相当 有 经 验 了 。 项 
目 组 中 还 有 另外 几 个 让 我 非常 佩服 的 人 一 一 鲁 肃 、 苗 人 凤 ， 二 人 后 来 
成 了 支付 宝 的 首席 系统 架构 师 和 业务 架构 师 。 就 这 么 跟着 这 样 一 帮 和 牛 
人 干 了 3 个 月 ， 支 付 宝 在 五 一 节 的 时 候 上 线 了 。 还 记得 几 个 DBA 在 做 数 
据 迁 移 时 候 的 回 样 ， 数 据 结构 已 经 面目 全 非 了 ，@ 正 牌 七 公 、 
@fenng、 多 隆 、 鲁 肃 摘 了 三 天 三 夜 。 我 们 熬夜 的 时 候 还 有 杭州 的 卖家 
跑 来 看 我 们 ， 有 一 位 是 壁 君 ， 后 来 直接 加 入 了 淘宝 。 

当时 那 热 火 朝 天 的 岁月 令 我 至 今 难 扎 ， 我 三 天 三 夜 没 回 家 的 时 
候 ， 我 老 克 还 打 电 话 过 来 问 * 你 到 底 还 爱 不 爱 我 了 ? "我 说 :“ 怎 么 会 不 
爱 呢 ? ” 

进 淘宝 的 第 一 年 ， 我 的 级 别 是 P1， 现 在 已 经 没有 P1 了 ， 后 来 调整 
过 ， 我 当时 进来 应 该 是 现在 的 P3， 记 得 那 年 年 底 的 时 候 ， 三 丰 给 了 我 4 


分 的 评价 〈 超 出 期 望 ) ， 人 然后 升级 为 P4， 那 是 我 成 长 最 快 的 一 段 时 
期 。 


第 二 年 (2005 年 一 2006 年 ) 

做 完 支 付 宝 ， 公 司 举办 了 一 场 硕大 的 庆祝 仪式 ， 带 我 们 一 帮 人 去 
了 千岛 湖 ， 玩 得 很 爽 ， 但 我 有 点 不 安 ， 因 为 我 与 他 们 在 一 起 才 3 个 月 ， 
实际 上 只 做 了 3 个 功能 ， 一 个 是 创建 支付 宝 交 易 的 接口 、 一 个 是 接收 支 
付 宝 订单 状态 的 接口 、 一 个 是 绑 定 和 解 绑 支 付 宝 账号 的 功能 ， 而 其 他 
牛人 设计 出 了 一 个 巨大 的 系统 ， 我 处 于 深 深 的 拜 服 中 。 半 年 之 后 ， 淘 
宝 网 组 织 的 郊游 又 去 了 千岛 湖 ， 后 来 ， 另 外 两 个 项 目的 庆祝 也 去 了 千 
岛 湖 ， 以 至 于 我 都 认识 那 边 的 道路 了 。 

从 千岛 湖 回来 ， 真 正 苦 副 的 日 子 开始 了 ， 我 很 长 一 段 时 间 都 在 做 
善后 的 工作 ， 就 是 支付 宝 系统 中 的 一 些 问题 。 由 于 支付 宝 和 淘宝 是 两 
个 独立 的 系统 ， 系 统 之 间 的 通信 是 一 个 大 问题 ， 而 银行 与 支付 宝 也 需 
要 通信 ， 于 是 问题 就 经 常 出 现 : 用 户 在 银行 付款 后 ， 未 必 能 通知 到 支 


付 宝 ， 支 付 宝 收 到 通知 后 ， 未 必 能 通知 到 淘宝 ， 于 是 用 户 的 钱 没 了 ， 
淘宝 的 系统 上 却 显 示 未 付款 ， 很 让 人 骨 溃 。 我 和 和 鲁 肃 尝试 了 很 多 种 办 
法 ， 一 开始 用 MQ， 但 并 发 量 上 来 之 后 老 丢 消息 ， 消 息 的 时 间 顺 序 也 会 
错 ， 后 来 他 做 了 一 个 消息 中 间 件 系统 ， 这 个 就 是 淘宝 的 Notify 的 纵 形 ， 
现在 Notify 一 天 能 发 送 几 亿 条 消息 通知 ， 能 保证 通知 到 ， 也 能 保证 不 重 
复 通 知 ， 还 能 保证 消息 有 次 序 ， 相 当 不 容易 。 

三 丰 看 我 在 支付 宝 方面 做 了 很 多 事情 ， 而 且 跟 鲁 肃 他 们 合作 得 这 
么 好 ， 还 以 为 我 水 平 大 有 长 进 ， 于 是 在 维护 着 支付 宝 接口 的 同时 ， 我 
开始 了 做 PM (项 目 经 理 ) 的 生涯 。 据 说 ， 我 是 淘宝 的 第 一 个 PM， 这 
让 我 很 爽 ， 我 在 做 PM 的 过 程 中 与 SQA 一 起 整理 出 了 《项 目 管理 流程 》 
《PM 工 作 手 册 》 《系统 设计 模板 》 等 开创 性 的 工作 ， 有 些 东 西 沿用 到 
了 现在 。 但 后 来 有 人 提出 敏捷 概念 的 时 候 ， 我 又 在 反思 ， 我 是 不 是 误 
导 了 淘宝 的 项 目 开发 模式 很 多 年 ? 

我 的 PM 生涯 从 2005 年 持续 到 2008 年 ， 这 三 年 又 大 致 分 两 个 阶段 ， 
一 个 是 “新 手 上 路 阶段， 自己 摸索 着 做 了 “商品 详情 拆 分 “收藏 夹 改 
造 " “支付 宝 认 证 ” 几 个 项 目 ; 另外 一 个 是 “死去 活 来 ”阶段 ， 做 了 “我 的 
淘宝 AJAX 版 ">、“ 招 财 进 宝 *、 “淘宝 旅行 "。 为 什么 是 死去 活 来 ? 因为 后 
面 这 三 个 项 目 死 了 两 个 ， 活 了 一 个 。 

“商品 详情 拆 分 是 在 2005 年 开始 做 的 ， 三 丰 说 让 我 当 项 目 经 理 ， 
我 看 到 “经 理 ” 两 个 字 就 吓 得 半死 ， 但 后 来 知道 该 项 目 组 就 我 和 拖 雷 两 
个 人 。 要 做 的 事情 非常 简单 ， 淘 宝 商 品 信息 表 一 开始 就 是 一 张 表 ， 商 
品 的 所 有 信息 都 在 这 张 表 中 ， 包 括 商 品 的 详情 ， 用 一 个 clob 字 段 存储 。 
大 家 应 该 知道 商品 的 详情 是 多 么 恐怖 的 一 个 字段 ， 据 说 ， 如 果 把 淘宝 
商品 详情 页 面 打 印 出 来 ， 平 均 约 5 米 长 ， 虽 然 当 时 没 这 么 长 ， 但 也 很 恐 
怖 了 ， 它 与 其 他 信息 放 在 一 起 严重 影响 数据 的 读 写 性 能 。 于 是 我 新 建 
了 一 张 表 来 存储 商品 详情 ， 普 通 的 商品 查询 不 会 用 到 这 张 表 ， 只 在 商 
品 详情 (Detail) 页 面 才 会 用 到 ， 做 完 之 后 ， 性 能 一 下 子 好 了 很 多 ， 我 
又 骄 做 了 很 久 。 再 后 来 我 知道 商品 的 详情 已 经 不 能 存放 数据 库 了 ， 放 
到 了 文件 系统 上 。 

“收藏 夹 改造 "是 一 个 稍微 大 点 的 系统 ， 最 早 ， 淘 宝 的 收藏 夹 只 能 
收藏 商品 ， 我 和 万 剑 、 领 军 等 人 把 收藏 夹 改造 成 能 收藏 店铺 、 收 藏 搜 
索 和 把 收藏 的 内 容 分 类 处 理 ， 当 时 的 UI 设 计 可 能 是 承志 @sharkUI 做 


的 ， 看 他 一 个 像素 一 个 像素 地 抠 ， 才 发 现 他 比 我 们 写 代 码 更 若 逼 。 这 
个 项 目 算是 一 个 比较 完整 的 项 目 过 程 了 ， 我 除了 写 代码 ， 也 做 一 些 工 
作 计 划 ， 所 以 后 来 就 开始 写 项 目 管理 的 文档 了 。 

“支付 宝 认 证 ”是 淘宝 的 一 个 创新 ， 淘 宝 在 成 立 之 初 就 要 求 卖 家 实 
名 认证 ， 最 早 的 认证 方式 是 让 用 户 上 传 身份 证 照片 ， 我 们 去 连接 公安 
系统 的 网 站 来 核对 信息 ， 核 对 一 个 要 交 5 元 钱 ， 成 本 相当 高 。 后 来 浅 雪 
@ 浅 的 雪 过 来 做 PD， 提 出 了 一 个 新 的 认证 方式 : 我 们 认为 银行 一 定 有 
用 户 的 身份 信息 ， 而 支付 宝 又 与 银行 有 合作 ， 那 就 可 以 通过 银行 的 用 
户 信 息 来 验证 身份 。 所 以 支付 宝 认证 的 原理 就 是 : 用 户 提 交 身 份 信息 
和 银行 账户 ， 我 们 往 这 个 账户 里 存 钱 ， 存 进去 之 后 ， 用 户 填 写 收 到 了 
多 少 钱 (我 们 号 称 存 过 去 的 是 1 元 钱 以 内 的 金额 ， 实 际 上 只 有 几 分 
钱 ) ， 如 果 用 户 填 写 的 与 我 们 向 里 面 存 的 是 一 致 的 ， 那 么 这 个 人 的 身 
份 就 是 对 的 。 这 不 仅 降低 了 认证 的 成 本 ， 也 使 认证 的 效率 由 原来 的 一 
周 左右 变 成 一 天 以 内 。 由 于 我 对 支付 宝 比 较 熟 ， 又 做 过 PM， 就 理 所 当 
然 地 做 起 了 这 个 项 目的 PM。 据 说 ， 这 个 项 目 后 来 申请 了 专利 ， 这 的 确 
是 一 个 很 大 的 创新 。 

这 三 个 项 目 我 做 得 很 顺利 ， 认 为 自己 已 经 称 得 上 是 项 目 经 理 了 ， 
但 巨大 的 失败 在 后 面 等 着 我 ， 由 于 后 面 那些 事情 想起 来 太 伤心 了 ， 先 
写 到 这 里 吧 。 


第 三 年 (2006 年 一 2007 年 ) 

2005 年 年 底 的 时 候 ， 我 结婚 了 ， 与 老婆 匆匆 领 了 证 就 往 公 司 跑 ， 
因为 当时 我 负责 了 一 个 更 大 的 项 目 ， 重 构 “ 我 的 淘宝 ”"。 由 于 太 勿 忙 ， 
结婚 证 掉 在 了 路 上 ， 后 来 有 人 送 到 了 民政 局 ， 结 果 是 一 天 去 民政 局 领 
了 两 次 结婚 证 。 

“我 的 淘宝 ”是 给 会 员 管 理 自己 的 商品 、 交 易 、 收 货 地 址 、 评 价 、 
投诉 的 地 方 ， 这 个 地 方 由 于 登录 之 后 才能 看 到 ， 所 以 风格 与 外 观 完全 
不 一 样 ， 很 长 时 间 都 没有 优化 过 ， 样 子 丑 ， 用 户 操 作 也 不 方便 ， 如 果 
一 个 人 有 很 多 商品 ， 上 下 架 还 需要 一 个 一 个 地 操作 ， 非 常 麻烦 。 这 时 
候 一 个 重要 人 物 登 场 了 承志 @SharkUI， 他 给 我 们 演示 了 最 牛 的 前 
端 交互 技术 ， 就 是 Gmail 上 那 种 AJAX 的 交互 方式 ， 可 以 拖 动 ， 可 以 用 
鼠标 右键 ， 也 可 以 选择 组 合 键 ， 操 作 完 毕 不 刷新 页 面 ， 管 理 商 品 犹如 
神助 。 除 了 承志 ， 还 有 一 个 牛人 加 入 了 项 目 组 一 一 一 灯 @ 喻 策 ， 这 是 
他 作为 PD 的 第 一 个 项 目 。 再 拉 上 万 剑 和 一 伙 工 程 师 ， 我 们 就 开始 工作 


了 ， 我 给 这 个 项 目 取 名 为 alps， 就 是 阿尔 摆 斯 山 ， 淘 宝 的 前 台 项 目 叫 
Denali， 后 台 叫 Mckinley， 都 是 名 山 ， 咱 们 这 个 要 更 有 名 。 做 项 目的 过 
程 中 ， 我 把 电脑 桌面 换 成 锋 峨 的 阿尔 摆 斯 山 ， 加 班 的 时 候 给 兄弟 们 买 
阿尔 和 摆 斯 糖 ， 大 家 干 得 热火 朝天 。 快 完工 的 时 候 ， 老 马 不 知 道 怎 么 回 
事 ， 突 然 出 现在 我 身后 ， 看 我 操作 了 一 遍 新 版 "我 的 淘宝 ”之 后 ， 问 我 
这 是 不 是 客户 端 软 件 ， 我 说 是 网 页 ， 他 抓 狂 了 ， 说 这 跟 客 户 端 软件 一 
样 ， 链 接 下 面 的 下 画 线 都 没有 ， 上 下 架 用 文件 夹 表示 ， 他 都 不 知道 怎 
么 操作 ， 卖 家 肯定 也 不 会 玩 。 被 他 这 么 一 说 ， 我 们 虽然 不 服 ， 但 也 留 
了 个 心眼 ， 于 是 做 了 一 个 beta 版 的 发 布 ， 在 老 的 版 本 之 外 让 一 部 分 用 户 
先 体验 新 的 版 本 。 

接 下 来 ， 淘 宝 历史 上 第 一 个 群体 性 事件 爆发 了 ， 试 用 完 新 版 本 的 
“我 的 淘宝 之后， 很 多 卖家 愤怒 了 ， 说 不 会 玩 儿 ， 一 灯 就 和 承志 一 起 
商量 如 何 把 页 面 改 得 像 网 页 ， 改 了 半 个 月 ， 愤 怒 依 然 没 有 平息 ， 我 很 
无 奈 地 看 着 这 两 个 人 在 那里 坚持 ， 然 后 跟 老板 们 商量 怎么 办 。 后 来 ， 
我 们 到 论坛 上 让 大 家 投票 要 不 要 使 用 新 版 我 的 淘宝 "， 投 票 结果 是 一 
半 以 上 的 人 反对 。 于 是 这 十 来 个 人 做 了 三 个 月 的 系统 被 杀 掉 了 。 我 当 
时 只 感觉 对 不 起 这 帮 兄 弟 们 ， 也 对 不 起 自己 领 的 这 三 个 月 的 薪水 ， 走 
路 都 抬 不 起 头 来 。 但 这 还 不 是 最 痛苦 的 ， 最 痛苦 的 是 我 们 下 线 之 后 ， 
另外 一 拨 卖 家 不 满 了 ， 说 这 么 好 的 功能 怎么 没有 了 ? 

虽然 “我 的 淘宝 AJAX 版 " 挂 了 ， 但 老板 们 也 没 说 我 什么 ， 我 自己 诚 
怕 诚 忍 地 总 结 出 了 项 目 过 程 中 的 几 大 罪过 发 给 大 家 ， 和 警示 后 人 ， 缓 解 
一 下 内 心 的 歉意 。 到 2006 年 “五 一 ”的 时 候 ， 另 一 个 划时代 的 项 目 启 动 
了 ， 就 是 “ 招 财 进 宝 ” (我 苦 逼 地 连续 失去 了 两 个 五 一 节 ) 。 财 神 说 要 
用 最 好 的 项 目 阵 容 ， 我 被 选中 了 ， 这 让 我 觉得 我 能 划分 到 最 好 的 员工 
之 类 ， 原 来 正 受 伤 的 心 又 痊愈 了 。 这 是 一 个 商品 P4P 的 系统 ， 就 是 按 成 
交付 费 。 我 们 认为 已 经 有 很 多 卖家 有 钱 了 ， 但 淘宝 上 这 么 多 商品 ， 他 
们 很 难 被 找到 ， 他 们 愿意 花 钱 让 商品 排 在 前 面 。 我 们 允许 卖家 购买 广 
告 位 ， 把 他 的 商品 按 一 定 算法 给 出 排名 (类 似 于 百度 的 竞价 排名 ， 这 
里 不 仅 能 看 出 卖家 交 了 多 少 钱 ， 还 可 知道 信用 、 成 交 量 、 补 收藏 数量 
等 ， 这 个 算法 很 复杂 ) 。 这 是 一 个 多 么 牛气 的 僵 利 模式 啊 ! 在 这 个 豪 
华 的 阵容 里 面 ， 乔 峰 @ 王 煜 磊 是 业务 方 ， 浅 雪 是 PD ， 开 发 有 黄 赏 、 进 
宝 、 晓 锋 、 长 空 ， 测 试 有 自在 、 非 烟 ，UED 是 青 桐 和 @sharkUI， 架 构 
师 是 行 壮 ，DBA 是 叶 开 。 


在 我 们 开发 的 过 程 中 ， 乔 峰 大 侠 踊 球 断 了 腿 ， 于 是 他 SOHO 办 公 ， 
经 常 在 网 络 的 另 一 头 给 我 们 打气 。 我 当时 第 一 次 听 说 SOHO 这 个 词 ， 只 
是 大 家 SO 的 是 home， 他 SO 的 是 hospital。 这 个 系统 进行 得 很 顺利 ， 但 
发 布 的 时 候 ， 更 大 的 群体 性 事件 出 现 了 ， 买 家 们 质疑 : 你 们 不 是 承诺 3 
年 不 收费 吗 ? 收 广告 费 不 是 收费 吗 ? 然后 我 们 的 竞争 对 手 趁机 在 各 种 
媒体 上 展开 公关 战 ， 甚 至 在 系统 中 开发 出 了 “一 键 搬家 ”， 搬 过 去 还 保 
留 淘宝 信用 这 样 的 “大 规模 杀伤 性 ”功能 。 然 后 ， 这 个 项 目 又 失败 了 。 
项 目下 线 的 那 一 天 ， 乔 峰 先 以 了 ， 财 神 说 男子 汉 大 丈夫 要 拿 得 起 ， 放 
得 下 ， 晚 上 去 虚 竹 家 请 大 家 吃 顿 饭 ， 算 是 项 目 结束 了 。 饭 桌 上 ， 他 才 
喝 了 两 杯 ， 就 醉 了 ， 我 看 大 家 都 吃 不 下 去 ， 也 不 敢 多 吃 。 结 束 的 时 
候 ， 我 和 小 军 送 他 回 家 ， 小 宝 力气 大 ， 背 着 他 ， 我 在 劳 边 撑 着 伞 ， 路 
灯 下 雾 蒙蒙 的 ， 小 雨 一 直下 。 

有 人 说 这 个 项 目的 失败 让 中 国电 子 商务 的 成 熟 延迟 了 好 多 年 ， 但 
这 个 项 目 背 后 的 人 真 的 损人 也 没有 利己 。 

接连 两 个 项 目 都 挂 了 ， 我 反倒 不 怎么 悲伤 了 ， 心 态 反 倒 轻 松 了 许 
多 ， 明 白 了 一 个 道理 : 很 多 东西 ， 不 是 你 努力 就 能 成 功 的 ， 也 许 应 了 
那 句 话 “ 谋 事 在 人 ， 成 事 在 天 ”。 

这 期 间 也 做 了 很 多 日 常 性 的 需求 工作 ， 印 象 最 深刻 的 是 胖 胡 斐 有 
一 次 给 我 提 了 一 个 需求 ， 年 底 要 做 一 个 抽奖 的 系统 ， 要 求 在 抽奖 人 数 
能 预 估 的 情况 下 ， 系 统 能 够 即时 开奖 ， 发 奖 数量 要 均匀 分 布 在 一 天 的 
时 间 内 ， 发 出 去 的 奖品 不 能 超过 预 设 的 值 ， 也 不 能 有 奖品 没 发 出 。 真 
会 难为 人 ， 我 想 了 很 久 才 设计 出 一 个 算法 ， 用 随机 数 来 做 抽奖 的 种 
子 ， 数 字 在 某 一 个 区 间 的 时 候 算 中 了 某 个 等 级 的 奖 ， 每 个 小 时 发 几 个 
奖 有 限额 ， 发 完 之 后 ， 在 这 个 小 时 内 的 数字 即便 在 中 奖 区 间 也 不 算 
中 ， 如 果 前 面 一 个 小 时 很 快 就 有 人 中 奖 ， 则 减 小 后 面 一 个 小 时 的 中 奖 
区 间 。 这 个 算法 后 来 被 应 用 到 多 次 抽奖 活动 中 。 

心 碎 的 第 三 年 就 这 么 过 去 了 ， 那 时 候 我 的 级 别 已 经 是 P5 了 。 


第 四 年 (2007 年 一 2008 年 ) 

“ 招 财 进 宝 ” 挂 掉 的 时 候 ， 乔 峰 哭 得 最 伤心 ， 有 人 拿 收费 这 个 问题 
来 大 举 攻 击 淘 宝 ， 他 说 :“ 有 一 天 淘宝 要 收费 的 时 候 ， 请 让 我 来 宣 
布 ”。 现 在 他 在 淘宝 商城 ， 商 城 收费 不 知道 是 不 是 由 他 宣布 的 ， 但 因为 
收费 的 问题 ， 商 城 又 经 受 了 一 次 攻击 ， 不 知道 是 不 是 同一 个 对 手 策划 
的 (本 人 想象 力 丰 富 ， 对 以 上 言论 概 不 负责 ) 。 

在 这 个 项 目 中 有 一 个 技术 细节 值得 说 说 ,， “淘宝 商品 详情 页 面 * 每 
天 的 流量 在 10 亿 次 以 上 ， 其 中 的 内 容 都 是 放 在 缓存 里 的 ， 做 “ 招 财 进 
宝 ” 的 时 候 ， 我 们 要 给 卖家 显示 他 的 商品 被 浏览 的 次 数 ， 这 个 数字 必须 
实时 更 新 ， 而 用 缓存 一 般 都 是 异步 更 新 的 。 于 是 商品 表 中 增加 了 这 样 
一 个 字段 ， 每 增加 一 个 PV， 这 个 字段 就 要 更 新 一 次 ， 发 布 上 去 一 个 小 
时 后 ， 数 据 库 就 挂 掉 了 ， 撑 不 住 这 么 高 的 更 新 。 数 据 库 撑 不 住 怎 么 
办 ? 一 般 的 缓存 策略 是 不 支持 实时 更 新 的 ， 这 时 候 多 隆 大 神 想 了 个 办 
法 ， 在 Apache 上 面 写 了 一 个 模块 ， 这 个 数字 根本 不 经 过 下 层 的 Web 容 器 


只 经 过 Apache) 就 写 入 一 个 集中 式 的 缓存 区 了 ， 这 个 缓存 区 的 数据 
再 异步 更 新 到 数据 库 。 好 像 什 么 问题 到 了 多 隆 手 里 ， 总 能 迎刃而解 。 

那 一 年 发 生 了 很 多 事情 ， 多 到 我 都 记 不 住 了 ， 我 只 模糊 地 记得 项 
目 结束 之 后 ， 组 织 结构 有 过 一 些 调整 ， 也 来 了 很 多 牛人 ， 尤 其 是 UED 
的 人 ， 例 如 ，@XX 的 三 通 〈 他 和 我 都 是 一 灯 的 四 个 门徒 之 一 ) 、@ 赵 
小 马 、 语 凝 、 圆 心 等 。 那 个 时 候 UED 开 始 分 交互 设计 、 用 户 研 究 、 前 
端 等 工种 ， 以 前 都 是 一 两 个 人 负责 所 有 的 工作 。 下 面 那个 项 目 中 ， 我 
们 有 了 深入 的 合作 ，UED 的 这 种 分 工 对 于 PM 来 说 ， 让 我 觉得 项 目 周期 
更 长 了 。 

悲 催 的 一 年 过 得 很 慢 ， 但 是 年 底 我 却 升 到 了 P6 的 级 别 。 

2007 年 春天 ， 我 老婆 回老家 生 孩 子 ， 我 在 公司 开始 生 我 的 孩子 ， 
就 是 下 一 个 项 目 “ 淘 宝 旅 行 ”。 我 之 所 以 觉得 这 个 项 目 像 是 自己 生 的 ， 
是 因为 我 从 最 早 的 商务 调研 就 跟 进 了 。 那 个 时 候 ， 支 付 宝 给 很 多 机 票 
代理 商 做 接口 ， 发 现 这 个 行业 有 很 大 的 利润 空间 ， 而 且 电 子 化 和 标准 
化 程度 非常 高 ， 就 想 弄 出 个 旅行 服务 的 平台 来 ， 但 是 支付 宝 的 研发 人 
员 都 忙 着 没 空 ， 于 是 跟 淘宝 谈 合 作 ， 我 们 做 一 个 集团 版 本 的 旅行 服 
务 ， 可 以 接 入 淘宝 、 支 付 宝 ， 也 可 以 接 入 B2B 的 系统 ， 后 来 我 们 做 出 第 
一 个 版 本 的 “淘宝 旅行 ?是 用 支付 宝 账 号 登录 的 ， 跟 现在 的 一 淘 接 入 的 
用 户 系统 相同 ， 当 时 很 多 人 感到 很 奇怪 : 怎么 不 用 淘宝 的 用 户 信息 ? 
老板 们 看 我 内 着 ， 合 作 方 也 是 我 比较 熟悉 的 支付 宝 ， 于 是 我 阔别 两 年 
之 后 ， 又 一 次 跟 支 付 宝 合作 了 。 

我 跟着 支付 宝 的 BD 孙权 、 夏 波 波 一 起 去 拜访 一 家 家 的 航空 公司 ， 
谈 合 作 方式 和 分 成 模式 ， 我 第 一 次 坐 在 谈判 桌 上 与 这 么 牛气 的 国企 谈 
判 ， 只 在 他 们 问 我 能 不 能 实现 的 时 候 做 一 下 技术 分 析 。 国 企 中 有 不 少 
有 眼光 的 人 才 ， 他 们 希望 做 点 创新 的 事情 ， 但 整个 体制 限制 太 多 ， 谈 
了 半年 都 没有 结果 。 于 是 我 们 又 转向 与 代理 商谈 判 ， 这 些 商 人 嗅觉 非 
常 灵敏 ， 他 们 意识 到 有 淘宝 这 么 多 的 用 户 能 接 入 ， 一 定 是 一 个 很 大 的 
市 场 。 他 们 都 很 积极 ， 于 是 “淘宝 旅行 ”的 模式 很 快 就 做 成 代理 商 作为 
商家 的 服务 平台 ， 代 理 商 赚钱 后 与 我 们 分 成 (分 多 少 ? 不 告诉 你 ) 。 

艰苦 的 商务 谈判 完成 之 后 ， 有 更 艰苦 的 项 目 开发 跟 进 ， 老 婆 不 在 
杭州 ， 也 不 问 “ 你 还 爱 不 爱 我 ? ”了 ， 我 专心 投入 到 项 目 中 ，2007 年 年 
底 ,， “淘宝 旅行 ”上线 了 。 上 线 的 时 候 ， 我 问 老板 们 用 什么 域名 ， 语 嫣 


姐姐 说 用 最 土 最 好 记 的 ， 于 是 jipiao.taobao.com 就 发 布 了 。 这 个 平台 上 
产生 的 第 一 笔 交 易 是 一 个 代理 商 的 老板 给 自己 买 的 机 票 ， 按 照 分 成 规 
则 ， 我 们 赚 了 几 块 钱 。 那 天 下 午 ， 财 神 和 语 娇 带 了 一 波 运 营 的 同事 ， 
敲 狗 打鼓 地 给 我 们 发 金币 巧克力 ， 告 诉 大 家 这 是 淘宝 第 一 笔 收 入 。 当 
时 我 被 一 拨 人 推 着 走 ， 拍 的 合影 也 没 人 发 我 一 份 。 这 个 项 目的 PD 是 小 
玉 ， 运 营 支 持 是 叶 青 和 文 纳 ， 交 互 设 计 是 语 凝 〈 从 那个 时 候 开 始 ， 我 
跟 更 多 的 女 同事 结 下 了 深厚 的 情谊 ， 所 以 我 开玩笑 说 打算 写 一 篇 外 传 
《我 生命 中 最 重要 的 十 二 个 女人 》 ， 呵 呵 ! ) ， 开 发 团队 是 震 北 、 空 
望 、 清 虚 、 腾 如 (他 们 是 《我 生命 中 最 重要 的 十 二 个 男人 》 之 一 ， 呵 
呵 ) 。 

当时 国内 机 票 市 场 的 老大 是 携程 ， 老 二 是 艺 龙 ， 我 们 的 平台 上 线 
之 后 很 长 时 间 内 ， 用 户 还 是 习惯 打 电 话 找 他 们 订 票 , “淘宝 旅行 ”的 发 
展 速度 其 实 是 很 慢 的 。 另 一 方面 ， 为 了 获取 实时 的 航班 信息 ， 我 们 必 
须 获 得 中 航 信 《中 国民 航 信息 网 络 股份 有 限 公司 的 简称 ) 的 支持 ， 而 
中 航 信 当 时 正 急于 推广 他 们 的 酒店 系统 。 于 是 在 接 下 来 的 半年 时 间 
内 ， 我 们 用 中 航 信 的 酒店 系统 做 了 “淘宝 酒店 ”， 跟 机 票 一 起 纳入 “淘宝 
旅行 ”， 中 航 信 也 把 IBE (Internet Booking Engine) 接口 给 了 我 们 。 我 
和 做 运营 工作 的 寻 女 们 整 天 盯 着 有 谁 在 我 们 这 里 订 了 机 票 ， 有 谁 订 了 
酒店 。 如 果 有 同学 、 同 事 或 亲朋 好 友 要 旅行 ， 我 们 就 给 他 们 推销 “淘宝 
旅行 ”。 记 得 到 2008 年 年 底 ， 机 票 销 量 才 几 百 张 。 

坐 在 我 们 办 公 室 旁边 的 是 “淘宝 彩票 ”的 团队 ， 哲 别 是 PM， 一 灯 是 
项 目 经 理 ， 经 过 了 “我 的 淘宝 AJAX 版 ”之 后 ， 一 灯 技 术 水 平 精进 ， 跟 彩 
票 公 司 谈 合 作 的 时 候 大 谈 AJAX 和 用 户 体 验 。 这 个 项 目 真 是 天 时 地 利 ， 
用 户 只 需要 两 块 钱 就 可 以 买 一 注 ， 用 支付 宝 下 注 非常 方便 ， 上 线 之 后 
销量 猛 增 ， 到 年 底 的 时 候 ， 有 两 注 彩 票 都 中 了 500 万 元 ， 一 时 之 间 ， 风 
光 无 限 。 兰 逼 的 机 票 团队 在 一 边 只 有 舱 幕 的 份 。 

看 着 这 个 孩子 在 慢 慢 长 大 ， 在 这 个 过 程 中 ， 我 们 做 了 零 零 星星 的 
一 些 日 常 需求 ， 实 际 上 工作 量 不 大 。 当 时 另 一 拨 人 被 关 进 了 湖畔 人 花 
园 ， 做 了 * 淘 宝 商城 >， 他 们 从 湖畔 花园 回来 之 后 , “淘宝 旅行 ”> 这 个 垂直 
市 场 的 项 目 被 划分 进 了 商城 ， 然 后 我 们 的 团队 被 并 入 商城 的 技术 团 
队 。 但 每 次 跟 行 闫 开 周 会 的 时 候 ， 他 们 讲 商 城 的 种 种 事情 ， 我 都 插 不 
进 话 。 到 了 年 底 ， 商 城 蓬勃 发 展 ， 但 机 票 的 业务 没有 太 大 起 色 ， 由 于 
我 的 技术 水 平 没有 多 大 进步 ， 结 果 年 底 被 评 了 3.25 分 ，P6 级 别 不 变 。 


这 时 候 有 人 来 挖 我 了 。 
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有 读者 担心 ， 写 到 后 面 会 不 会 变 太 监 了 。 其 实 ， 越 往 后 面 越 难 
写 ， 一 方面 是 那些 人 就 在 你 劳 边 ， 你 要 顾及 他 们 的 感受 ; 而 那些 事 ， 
也 才刚 刚 过 去 或 者 正在 进行 中 ， 身 在 其 中 ， 很 难 有 个 客观 的 描述 。 不 
过 既然 都 号 了 这 么 多 ， 那 就 继续 写 下 去 吧 ， 后 面 的 事情 比较 近 ， 也 不 
太 有 名 ， 估 计 感 兴趣 的 人 不 多 了 。 

我 曾经 写 过 一 篇 博文 ， 是 对 于 “小 黑 屋 ” 的 描述 ， 淘 宝 有 个 传统 ， 
很 牛 的 项 目 都 要 在 小 黑 屋 中 进行 ， 当 年 我 们 做 “我 的 淘宝 "和 “ 招 财 进 宝 ” 
的 时 候 ， 有 人 羡慕 我 被 关 在 一 个 小 黑 屋 里 面 。 到 了 2008 年 的 时 候 ， 我 
开始 禾 莫 别 的 天 在 小 黑 屋 中 的 人 了 。 这 样 的 人 有 两 氢 ， 一 拨 人 做 了 传 
说 中 的 “淘宝 商城 >， 一 拨 人 做 了 传说 中 的 “淘宝 系统 3.0”。 做 淘宝 商城 
的 那 拨 人 暂且 不 说 ， 淘 宝 主 站 系统 在 那个 时 候 经 历 了 一 次 翻天 履 地 的 
变化 。 

因为 发 展 实在 太 快 ， 淘 宝 的 系统 一 直 处 于 变化 之 中 ， 但 大 的 版 本 
变迁 大 概 有 两 次 ， 一 次 是 把 最 初 那 个 LAMP 架 构 的 系统 迁移 到 Java 平 台 
上 ， 一 次 是 把 集中 的 Java 系 统 拆 分 成 多 层 的 分 布 式 系统 。 从 PHP 到 Java 
在 2004 年 就 迁移 完毕 了 ， 我 进 淘宝 的 时 候 正 赶 上 迁移 完成 后 Sun 的 工程 


师 开始 做 支付 宝 ， 所 以 我 错过 了 。 从 集中 的 Java 平 台 拆 分 成 多 层 的 分 布 
式 系 统 时 ， 我 在 做 “淘宝 旅行 *， 又 错过 了 。 

我 一 直 相 信 ， 像 “淘宝 旅行 ?这 样 的 垂直 市 场 才 是 最 好 的 业务 模 
式 ， 不 可 能 所 有 的 商品 用 同一 种 展示 方式 ， 也 不 可 能 所 有 的 交易 用 同 
一 个 流程 。 但 在 主 站 拆 分 之 前 ， 要 做 垂直 市 场 只 能 重新 做 一 个 系统 ， 
拆 分 之 后 ， 只 需要 在 业务 逻辑 层 重 组 一 下 即 可 。 所 以 这 次 网 站 的 拆 分 
不 仅 撑 住 了 不 断 上 涨 的 流量 ， 也 支持 了 后 续 几 年 新 业务 的 发 展 。 在 拆 
分 的 过 程 中 有 很 多 技术 的 创新 ， 我 们 从 使 用 技术 到 了 创造 技术 的 阶 
段 。 记 得 有 一 次 我 们 与 腾讯 的 工程 师 交 流 ， 大 家 提起 那个 时 候 各 自 做 
了 一 个 文件 存储 系统 ， 仿 照 GFS ， 淘 宝 做 了 一 个 TFS (Taobao File 
System) ， 腾 讯 做 了 一 个 TFS (Tencent File System) ， 在 GFS 的 理论 
基础 上 上， 各自 有 不 同 的 创新 。 除 此 之 外 ， 还 有 Key-value 的 缓存 系统 、 
消息 中 间 件 、Java 中 间 件 、 海 量 数据 的 存储 和 计算 等 。 一 个 系统 发 展 到 
10 亿 次 流量 的 级 别 ， 你 不 得 不 做 技术 创新 。 

这 些 我 都 错过 了 。 

但 “淘宝 旅行 "最 初 两 年 的 发 展 非常 缓慢 ， 商 城 在 做 业务 的 创新 ， 
主 站 在 做 技术 的 创新 ， 我 们 这 个 团队 游离 于 商城 和 淘宝 主 站 之 外 。 这 
个 时 候 ， 有 人 来 挖 我 了 。 

我 总 是 容易 被 女人 说 动 ， 尤 其 是 漂亮 的 女人 ， 而 郭 关 就 是 这 样 的 
女人 。 她 问 我 淘宝 主 站 拆 分 之 后 ， 对 测试 有 什么 挑战 ? 我 说 系统 分 层 
多 了 ， 出 错 的 概率 大 了 ， 但 功能 测试 无 法 探测 到 下 层 。 她 问 有 没有 办 
法 深入 到 代码 级 别 来 测试 ? 我 说 有 ， 但 很 难 做 。 她 说 难 才 找 你 啊 ， 有 
什么 办 法 来 做 ? 我 说 做 单元 测试 ， 但 单元 测试 最 好 让 工程 师 自 己 去 
做 ,我 们 做 再 往 上 一 层 接口 的 测试 。 然 后 ， 她 说 英雄 所 见 略 同 ， 他 们 
已 经 有 几 个 人 在 做 了 ， 问 我 愿 不 愿意 一 起 把 这 事 做 大 。 这 时 我 发 现 她 
盆 了 一 个 坑 给 我 跳 。 不 过 这 是 淘宝 项 目 开 发 中 一 项 很 大 的 变化 ， 如 果 
做 好 的 话 ， 将 对 系统 的 稳定 性 有 很 大 保障 ， 而 我 也 觉得 每 天 在 那里 卖 
机 票 有 点 乏味 了 ， 那 就 弄 点 没 人 弄 过 的 事情 吧 。 

我 做 过 开发 ， 做 过 PM， 兼 职 做 过 PD， 还 像 SQA 一 样 做 过 几 个 流 
程 ， 在 2008 年 年 底 ， 我 又 开始 了 测试 工程 师 的 生涯 。 进 到 测试 团队 之 
后 ， 我 发 现 以 前 对 测试 的 认识 都 太 肤 浅 了 ， 尤 其 是 淘宝 的 测试 团队 ， 
其 测试 技能 和 测试 方法 是 业内 顶尖 的 ， 我 要 做 的 就 是 招募 一 个 能 写 Java 


代码 的 有 测试 思路 的 团队 ， 但 后 来 发 现 没 有 这 样 的 人 ， 于 是 招募 能 写 
代码 的 ， 然 后 给 他 们 培训 测试 方法 ， 另 外 ， 也 吸收 能 做 测试 的 ， 给 他 
们 培训 写 代 码 的 技能 。 在 2009 年 上 半年 ， 我 大 半 的 精力 都 放 在 了 招 人 
和 培养 人 上 面 ， 团 队 从 4 个 人 增加 到 19 个 。 我 记得 跟 铁 花 一 起 做 接口 测 
试 工程 师 的 培训 ， 有 个 外 号 叫 老 忽 的 ， 给 我 们 取 了 个 名 字 一 一 “ 花 柳 组 

接口 测试 的 思路 很 简单 ， 就 是 用 测试 代码 来 验证 系统 代码 的 逻辑 
是 否 正确 。 但 做 起 来 很 难 ， 最 大 的 困难 就 是 被 测 代码 太 “ 拥 抱 变化 ” 
了 ， 三 天 两 头 地 变 ， 测 试 代码 经 常会 失效 ;， 另 一 个 问题 就 是 要 验证 一 
个 业务 有 逻辑， 也 许 要 用 10 倍 的 测试 代码 才能 覆盖 ， 所 以 ， 这 事 儿 也 是 
一 个 体力 活 。 我 们 发 现 系统 越 往 下 层 ， 变 动 越 小 ， 人 逻辑 越 简 单 ， 于 是 
我 们 就 从 底层 的 IC、TC、UIC 开 始 测 试 。 测 试 代 码 写 完 之 后 ， 放 入 持 
续集 成 的 环境 中 ， 一 旦 被 测 代码 提交 SVN ， 测 试 代码 就 回归 一 遍 ， 把 
错误 信息 发 布 出 来 。2009 年 是 这 个 团队 异常 艰难 的 一 年 ， 我 们 把 底层 
的 代码 都 做 了 接口 测试 ， 有 些 还 有 性 能 的 测试 。 我 记得 做 UIC 接 口 测试 
的 时 候 ， 模 拟 了 10 亿 次 以 上 的 请 求 量 ， 结 果 发 现 了 JDK 中 的 Bug， 并 提 
交 给 了 Sun 公 司 。 做 这 些 事情 的 过 程 中 ， 我 们 也 对 常用 的 测试 方法 做 了 
一 个 抽象 处 理 ， 弄 了 一 个 测试 的 框架 ， 写 了 一 本 《接口 测试 白 皮 
人 

我 跟 郭 天 说 ， 既 然 我 们 做 了 这 么 多 事情 ， 有 这 样 的 实力 ， 就 可 以 
高 调 一 点 ， 向 外 传播 我 们 的 影响 力 ， 于 是 我 们 提出 了 一 个 愿景 :“ 做 测 
试 的 行业 标准 *。 她 任命 我 们 “ 花 柳 组 合 ” 一 方面 去 维护 博客 (地 址 为 
qa.taobao.com) ， 一 方面 对 内 开展 大 量 的 学 习 和 培训 ， 我 们 叫 它 “3T 交 
流 会 ” (Taobao Test Technology、 Taobao Test Team 或 者 Taobao Test 
Training 都 行 ) 。 

在 测试 团队 做 得 很 开心 ， 也 有 机 会 跟 更 多 可 爱 的 女孩 子 共事 。 但 
从 很 多 人 的 眼光 来 看 ， 一 个 开发 的 人 员 去 做 测试 好 像 有 点 奇怪 ， 我 也 
常常 思索 自己 这 么 跳 来 跳 去 到 底 好 不 好 。 直 到 前 面 一 段 时 间 看 到 网 上 
流行 三 种 青年 的 说 法 ， 我 也 把 工程 师 大 致 分 了 类 : 普通 工程 师 跟着 业 
务 跑 ， 来 啥 需求 做 哈 事 ; 文艺 工程 师 专 注 于 自己 的 领域 ， 研 究 得 非常 
精深 ; 2B 工 程 师 跳 来 跳 去 ， 啥 都 干 ， 啥 都 浅 党 辑 止 ;还 有 一 种 工程 师 
叫 牛 B 工 程 师 ， 哈 都 能 干 ， 哈 都 精通 〈 这 种 人 在 工程 师 心 中 叫 “ 神 ”) 。 


而 我 应 该 属于 第 三 种 ， 不 过 幸运 的 是 ， 淘 宝 里 的 机 会 太 多 了 ， 我 做 的 
都 是 自己 喜欢 的 事情 。 

2008 年 年 底 ， 我 的 级 别 从 P6 提 升 到 了 M1， 悲 剧 的 是 ， 过 了 一 年 之 
后 ， 公 司 更 加 重视 专业 能 力 ， 即 M1==P6。 

也 许 是 看 我 在 测试 团队 把 培训 做 得 风 生 水 起 的 原因 ，2009 年 年 
底 ， 又 有 人 来 找 我 了 。 


第 六 年 (2009 年 一 2010 年 ) 

作为 一 个 2B 工 程 师 ， 我 渐渐 地 开始 不 务 正 业 ， 到 2009 年 就 很 少 写 
代码 了 ， 只 做 一 些 上 通 下 达 、 资 源 协调 、 关 系 处 理 、 甩 手掌 柜 之 类 的 
事情 ， 完 成 了 一 个 P 到 M 的 转变 (从 另 一 种 意义 上 说 ， 我 这 个 码 农 废 
了 ) 。 但 做 了 M (管理 ) 之 后 ， 才 知道 管理 真 的 是 一 门 艺术 ， 尤 其 是 
管理 一 群 女孩 子 的 时 候 ， 简 直 是 处 于 艺术 殿堂 的 回 峰 。 那 时 候 从 一 位 
大 侠 那 里 听 到 一 个 理论 ， 作 为 M， 就 不 可 能 做 到 让 所 有 的 人 都 喜欢 
你 。 这 对 于 一 贯 喜欢 做 好 人 的 我 来 说 ， 很 有 难度 。 但 做 了 两 年 M 之 
后 ， 有 人 说 我 是 个 “老好人 ”， 这 真是 一 个 很 大 的 打击 ， 说 明 我 这 个 M 没 
有 做 好 。 


据说 是 因为 有 人 推荐 ，2009 年 年 底 ， 老 板 的 老板 的 老板 来 找 我 ， 
我 以 为 出 啥 大 事 了 ， 原 来 是 他 们 发 现 团队 大 了 ， 壁 垒 也 大 了 ， 知 识 的 
传播 和 传承 有 很 大 障碍 ， 需 要 一 个 专业 的 技术 培训 团队 。 而 我 ， 哈 都 
干 过 ， 又 喜欢 张罗 些 培训 和 交流 的 事情 ， 似 乎 挺 合 适 的 。 我 认为 团队 
的 成 长 是 M 的 第 二 等 大 事 (第 一 等 是 干 好 活 ) ， 那 跟 带 一 个 小 团队 来 
比 ， 支 持 整 个 大 部 门 的 成 长 似乎 更 能 发 挥 我 的 余热 。 但 这 个 我 一 手 建 
立 起 来 的 团队 ， 大 部 分 人 都 是 我 找 了 无 数 简 历 、 打 了 无 数 电话 才 找 到 
的 ， 我 投入 了 太 多 的 感情 ， 实 在 不 舍 。 思 前 想 后 ， 心 里 斗争 了 很 久 ， 
明白 大 家 都 能 独当一面 了 ， 我 的 离开 对 他 们 没 哈 损失。 于 是 挥 一 挥 衣 
袖 ， 我 走 了 ， 不 过 还 是 没 妨 住 眼泪 。 

这 一 年 的 测试 生涯 使 我 仿佛 又 处 于 最 初 的 创业 时 期 ， 理 论 、 方 
法 、 技 能 、 团 队 都 是 从 无 到 有 ， 跟 测试 团队 中 其 他 人 员 的 配合 也 是 从 
生 跻 到 默契 ， 所 有 的 事情 都 是 摸索 着 在 做 。 这 一 年 ， 我 的 扩 术 和 管理 
水 平 没 多 大 提升 ， 却 犯 了 很 多 错误 。 团 队 成 员 之 间 出 现 问题 的 时 候 后 
知 后 觉 ， 处 理 人 员 关 系 的 问题 简单 粗暴 ， 工 作 的 安排 像 是 甩 手 掌柜 。 
但 这 一 切 过 后 我 收获 的 是 心态 变 了 ， 人 慌乱 之 后 开始 变 得 从 容 。 

接 下 来 我 们 新 的 团队 成 立 了 ，@ 展 堂 、@ 早 安 微 被 安 、@ 奇 怪 的 伟 
大 是 最 早 入 伙 的 。 我 们 取 了 一 个 很 霸气 的 名 字 “@ 淘 宝 技术 大 学 *"， 还 有 
英文 名 Taobao University of Technology， 定 位 是 做 一 个 企业 大 学 ， 像 惠 
普 商学 院 和 摩托 罗拉 大 学 那样 ， 但 是 要 做 什么 其 实 也 不 知道 。 我 们 看 
每 年 都 有 几 百 名 应 届 生 入 职 ， 而 很 多 技术 都 是 外 面 学 不 到 的 ， 那 就 先 
给 他 们 进行 培训 吧 。 

于 是 淘宝 技术 大 学 旗下 第 一 个 项 目 开始 启动 了 ， 我 们 叫 它 “ 逐 浪 
户 ”， 取 长 江 后 滔 推 前 浪 之 意 。 我 们 收集 研发 部 中 所 有 的 业务 、 框 架 、 
规范 、 流 程 、 工 作 方法 ， 教 给 这 些 新 人 人。 这些 知识 收集 上 来 之 后 ， 我 
们 发 现 需要 有 两 个 月 的 时 间 才 能 培训 完 ， 于 是 逐 浪 堂前 面 儿 期 的 同学 
接受 了 我 们 两 个 月 的 知识 灌输 。 然 后 我 们 去 访谈 他 们 的 意见 ， 发 现 一 
个 最 大 的 问题 ， 就 是 东西 太 多 了 ， 如 同 把 天 山 童 姥 的 功力 传输 给 一 个 
路 人 甲 一 样 ， 他 会 骨 溃 的 。 当 然 ， 这 些 同 学 也 有 不 少 是 像 虚 竹 这 样 
的 ， 本 身 天 资 陪 匡 ， 可 以 接受 这 些 东 西 ， 成 长 很 快 。 

2010 年 ， 我 们 把 主要 精力 都 投入 到 了 应 届 生 的 培训 中 ,“ 逐 浪 堂 ” 
项 目 几 经 修改 ， 我 们 对 知识 分 门 别 类 ， 对 课程 精益 求 精 ， 最 终 成 型 : 


应 届 生 接受 两 周 的 “ 逐 浪 堂 * 脱 产 培 训 ， 内 容 是 通用 技能 ;， 进 阶 版 的 技 
能 放 入 在 职 培 训 ， 叫 做 * 追 风 党 >; 经 验 分 享 和 大 师 交 流 叫 做 * 百 家 讲 
坛 ?>; 还 有 一 拨 社 会 招聘 的 员工 ， 他 们 参加 3 天 的 脱产 培训 ， 叫 做 * 飞 云 
堂 ”， 主 要 传授 淘宝 特有 的 技术 和 框架 。 支 撑 这 些 项 目 开 展 的 是 一 个 讲 
师 管 理 机 制 、 一 个 课程 管理 机 制 和 一 个 在 线 报名 的 培训 平台 。 

在 开展 工作 的 过 程 中 ， 我 们 也 有 不 少 创新 。 兄 第 公司 的 培训 管理 
员 曾 经 说 过 一 件 事 情 ， 他 们 找 培训 公司 为 他 们 采购 一 个 数据 库 的 课 
程 ， 培 训 公 司 的 人 说 :“ 最 好 的 DBA 都 在 你 们 这 里 了 ， 你 让 我 到 哪里 去 
找 ? ”我 们 才 发 现 其 实 很 多 业内 顶尖 的 人 才 都 在 公司 内 部 。 那 我 们 能 不 
能 像 采 购 外 面 的 课程 一 样 从 内 部 讲师 这 里 采购 课程 呢 ? 在 得 到 老板 们 
的 支持 之 后 ， 我 们 开始 花 重金 在 内 部 悬赏 这 样 的 课程 ， 把 某 项 技术 讲 
透 ， 需 要 8 个 小 时 以 上 的 时 间 ， 需 要 有 有 良好 的 课程 设计 和 授课 技能 。 悬 
赏 发 出 之 后 ， 一 下 挖 出 了 十 来 门 这 样 的 课程 。 说 是 重金 ， 其 实 比 他 们 
去 外 面 讲 课 的 价格 还 是 要 低 很 多 ， 而 且 这 样 一 整 天 以 上 的 课程 ， 对 讲 
师 来 说 是 工作 之 外 一 个 很 大 的 投入 ， 给 些 激励 也 是 应 该 的 。 于 是 他 们 
讲 过 几 堂 课 之 后 ， 拿 着 我 们 发 的 iPad， 既 感觉 荣耀 ， 又 帮 技 术 大 学 做 了 
很 好 的 广告 。 

在 工作 迅速 开展 的 过 程 中 ， 团 队 也 在 不 断 地 壮大 ， 这 时 候 又 来 了 
@ 唐 甜 cr、@ 风 云 啊 叫 嘴 ， 中 间 也 有 几 个 实习 生 走 来 换 去 ， 其 中 一 位 的 
真名 被 我 们 注册 成 班主 任 的 小 二 账号 ， 到 现在 都 成 了 花 名 。 另 外 ， 还 
有 一 个 兄弟 团队 需要 提 一 下 ， 因 为 我 们 之 间 的 关系 比较 亲密 ， 我 们 做 
内 部 的 培训 ， 他 们 做 外 部 的 交流 。 迄 今 为 止 ， 他 们 已 经 成 功 举 办 了 两 
届 @velocityChinaWeb 性 能 和 运 维 大 会 ， 也 举办 了 D2、iData、iTest、 
aDev 等 很 多 交流 会 。 他 们 主 外 ， 我 们 主 内 。 这 个 团队 的 负责 人 是 @ 灵 
小 珊 ， 一 个 简洁 利索 的 姑娘 。 

2009 年 ， 我 刚 从 测试 部 门 到 技术 大 学 ， 没 有 晋升 ， 我 也 觉得 的 确 
不 够 资格 。 在 2010 年 年 底 的 时 候 ， 我 充满 信心 ， 那 时 候 淘 宝 的 晋升 机 
制 变 了 ， 需 要 对 一 个 晋升 委员 会 做 汇报 ， 很 多 人 从 述职 面试 回来 都 深 
受 打 击 ， 我 也 是 其 中 一 个 。 老 板 们 问 了 我 一 个 问题 “你 觉得 培训 的 本 质 
是 什么 ? ”我 说 这 是 一 个 好 问题 ， 结 果 是 我 继续 留 在 了 M1 的 级 别 上 。 


和 长 和 -于 南 站 


第 七 年 (2010 年 一 2011 年 ) 

这 一 期 先 打 广告 ， 哈 哈 。 

首先 帮 @ 胖 胡 斐 推销 他 的 新 书 《 玩 法 变 了 》， 这 是 一 本 讲述 淘宝 
店 怎么 运营 的 好 书 ， 用 一 个 很 俗 的 词 来 形容 ， 就 是 “干货 ! ” 书 中 提 到 
抽奖 的 玩法 ， 其 中 有 一 次 活动 就 是 我 写 的 代码 。 在 “魅力 属性 ”这 个 篇 
章 中 也 出 现 了 我 的 名 字 ， 嘿 嘿 。 

然后 再 打 一 个 广告 ， 就 是 老 包 宗 曦 翻译 的 《触动 人 心 》， 主 要 介 
绍 苹果 上 的 用 户 交 互 ， 也 是 精品 。 我 在 淘宝 遇 到 的 牛人 很 多 ， 但 心 甘 
情愿 拜倒 在 他 的 牛仔 裤 下 的 神 人 不 多 ， 而 胖 胡 斐 和 老 包 属于 神 人 这 个 
范畴 。 我 和 胖 胡 斐 一 起 学 车 ， 我 们 倒车 都 是 回头 看 车 尾 ， 只 有 胖子 扭 
不 过 头 ， 他 是 看 后 视 镜 倒车 的 。 另 外 ， 这 个 家 伙 过 圆 饼 总 是 会 压 到 
边 ， 被 @ 华 黎 曾 完 杰 和 教练 嘲笑 的 都 快 尾 恼 了 。 宗 上 曦 之 所 以 被 我 佩 
服 ， 主 要 是 这 家 伙 玩 啥 都 能 玩 出 境界 ， 他 对 摄影 的 研究 非常 深入 ,“ 宗 
陪 观 片 会 " 带 出 了 很 多 摄影 爱好 者 ， 他 不 在 淘宝 了 ， 这 个 组 织 还 活跃 至 


从 
Vo 


最 后 就 要 为 我 们 的 团队 打 广 告 了 ， 第 一 年 ， 我 们 对 淘宝 技术 大 学 
是 摸索 着 玩 ， 主 要 是 培训 了 几 百 名 应 届 生 。 第 二 年 ， 也 就 是 2011 年 ， 
是 我 们 全 面 开 花 的 一 年 。 先 说 说 出 场 的 人 物 : @ 展 诗 、@ 早 安徽 微 安 、 
@ 唐 甜 h0、@ 奇 怪 的 伟大 、@ 风 云 哆 罗 嘴 、@DY- 段 燕 、@ 高 小 料 、 


@Ciera 米 _ 米 ..…. 还 有 几 个 没有 微 博 的 人 ， 以 姑娘 居多 ， 而 且 个 个 可 以 
说 是 才 貌 双全 、 色 艺 双 绝 。 

在 2011 年 ， 队 伍 壮 大 了 ， 能 做 的 事情 也 多 了 ， 年 初 我 们 做 了 需求 
调研 ， 针 对 核心 系统 和 底层 产品 开发 出 了 一 系列 课程 ， 有 云 计算 系 
列 、 海 量 存 储 系 列 、Oracle 系 列 、MySQL 系 列 、 操 作 系 统 系 列 、 小 众 
语言 系列 、JVM 系 列 、Java 内 存 调 优 、 搜 索 技 术 系 列 、 广 告 技术 系列 
等 。 也 根据 这 两 年 公司 技术 战略 的 几 个 关键 词 : 稳定 、 性 能 、 成 本 、 
用 户 体验 ， 开 发 出 了 稳定 性 系列 、 性 能 优化 系列 、 用 户 体验 系列 课 
程 。 还 根据 日 常 的 热门 技术 做 出 了 秒杀 系统 的 设计 和 优化 、 双 十 一 背 
后 的 技术 体系 一 道 又 一 道 的 技术 大 和 餐 。 

在 这 里 也 有 必要 提 一 下 ， 这 两 年 淘宝 的 技术 团队 飞速 发 展 ， 我 对 
几 位 老板 们 也 有 了 敬佩 之 情 。 技 术 团 队 成 立 了 “技术 委员 会 ”执掌 技 术 
的 发 展 方向 和 人 才 的 评估 ， 成 立 了 性 能 、 稳 定 、 成 本 、 用 户 体验 等 各 
个 小 组 ， 招 募 了 专业 能 力 非 常 强大 的 人 人才， 分 管 重要 的 指标 ， 使 整个 
网 站 系统 的 发 展 越 来 越 健 康 。 这 两 年 ， 淘 宝 的 技术 也 逐渐 走向 开放 ， 
有 了 面向 开发 者 的 开放 平台 ， 也 把 自己 的 核心 架构 和 中 间 件 都 开放 出 
去 了 ， 甚 至 把 我 们 做 的 低 功 耗 服务 器 的 硬件 结构 都 变 成 了 开源 的 。 淘 
宝 前 些 年 从 开源 社区 获得 了 不 少 技术 ， 现 在 我 们 真心 实意 地 开始 回报 
整个 互联 网 行业 了 。 

同时 ， 我 们 也 向 前 延伸 我 们 的 触角 ， 与 公司 的 HR 一 起 走 进 学 校 ， 
在 浙江 大 学 成 立 了 浙大 淘宝 俱乐部 ， 在 大 连理 工大 学 成 立 了 大 工 淘宝 
俱乐部 ， 并 送 去 了 几 个 优秀 课程 ， 也 给 同学 们 做 了 我 们 提出 的 实验 性 
项 目 。 我 们 也 跟着 集团 ， 与 ACM 中 国 区 组 委 会 一 起 举办 了 夏季 论坛 和 
预选 赛 ， 让 学 生 亲 近 了 企业 ， 也 让 我 们 的 研发 部 门 亲近 了 优秀 的 学 
生 。 

2011 年 上 半年 ， 我 还 纠结 在 “培训 的 本 质 是 什么 ? ”这 样 的 问题 上 。 
想 的 多 了 ， 做 的 少 了 ， 主 要 是 姑娘 们 在 干 活 ， 她 们 发 挥 了 强大 的 能 
量 ， 组 织 了 四 百 多 次 培训 ， 反 馈 和 辅导 的 讲师 也 有 三 百 多 名 ， 给 我 们 
研发 部 每 个 工程 师 提供 了 差不多 14 个 小 时 的 培训 。 我 从 《ASTD 美 国 培 
训 和 发 展 论坛 2009 年 度 报告 》 中 了解 到 ， 美 国 培训 做 得 比较 好 的 企业 
中 ， 人 均 培训 时 长 在 19 个 小 时 左右 ， 而 天 朝 的 企业 中 被 统计 到 的 有 培 


训 的 平均 时 间 不 到 5 个 小 时 。 而 从 培训 管理 员 人 均 产 出 量 来 看 ， 我 们 超 
过 了 美国 2009 年 的 数据 。 

在 我 讲 概念 和 数据 的 时 候 ， 姑 娘 们 已 经 开始 在 研究 细节 了 ， 研 究 
桌 椅 怎 么 摆 放 比较 合理 、 学 员 怎 么 邀约 会 有 比较 高 的 出 席 率 、 讲 师 在 
课堂 上 容易 出 现 哪 几 类 问题 、PPT 的 字号 多 大 在 后 排 能 看 得 清 ...... 她 们 
把 培训 的 工种 逐步 细 化 ， 每 个 环节 都 有 操作 指南 ， 也 有 了 很 多 知识 的 
沉淀 和 经 验 的 总 结 。 姑 娘 们 ， 你 们 很 棒 ! 

培训 的 本 质 到 底 是 什么 呢 ? 经 过 老板 提 点 ， 我 们 认为 培训 的 本 质 
是 :“ 通 过 知识 的 流转 ， 促 进 员工 的 成 长 ， 进 而 推动 公司 业绩 的 提 
升 。” 那 又 有 老板 会 问 :“ 你 们 怎么 证 明 自 己 的 工作 提高 了 公司 的 业 
绩 ? ”这 是 一 个 好 问题 ， 呵 呵 ...... 有 一 天 我 听 到 农夫 山泉 的 一 个 广告 ， 
说 “我 们 不 生产 水 ， 我 们 是 大 自然 的 搬运 工 >”， 我 灵光 一 内 、 再 闪 .……. 
“我 们 不 生产 知识 ， 我 们 是 知识 的 搬运 工 ”。 我 们 搬 得 越 多 ， 别 人 接收 
得 越 多 ， 我 们 的 价值 就 越 大 。 我 不 知道 我 这 瓶 水 是 拯救 了 饥 渴 的 生 
命 ， 还 是 哈 到 了 谁 的 肺 ， 但 我 知道 它 一 定 有 价值 。 

随 着 理论 的 补充 和 姑娘 们 的 努力 〈@ 奇 怪 的 伟大 别 介 意 ， 我 们 把 
你 当 姑 娘 了 ) ， 在 年 中 特殊 晋升 的 机 会 中 ， 我 升 了 一 级 ， 变 成 了 M2。 

老 马 说 过 “唯一 的 不 变 就 是 变化 ”>， 年 中 晋升 之 后 ， 公 司 有 了 翻天 
覆 地 的 变化 。 淘 宝 一 拆 四 ， 变 成 了 淘宝 网 、 一 淘 网 、 淘 宝 商 场 和 共享 
业务 平台 ， 我 成 了 共享 业务 平台 的 人 ， 然 后 共享 业务 平台 又 拆 分 ， 我 
成 了 集团 的 人 。 跟 我 们 一 起 变 的 还 有 成 立 不 久 的 “产品 大 学 ”* 和 “运营 
学 *”， 三 个 大 学 顺理成章 地 统一 了 ， 变 成 了 “淘宝 学 院 ”， 以 前 的 校长 成 
了 院 长， 我 就 荣 升 为 技术 大 学 的 校长 。 人 多 了 ， 可 以 集中 资源 办 大 
事 ， 但 层级 不 需要 这 么 多 ， 而 我 做 的 这 事 说 是 P 或 者 M 都 可 以 ， 而 且 一 
个 被 人 说 是 “老好人 ”的 M 估 计 也 没 大 前 途 。 于 是 我 转 了 ， 级 别 变 成 了 
P7， 头 衔 是 “培训 专家 ”， 属 于 专家 和 教授 的 级 别 了 。 

七 年 了 ， 我 的 头发 越 来 越 少 ， 付 出 了 7 年 的 青春 ， 也 得 到 了 不 少 ， 
除了 金钱 ， 最 珍贵 的 就 是 认识 了 一 帮 牛 人 人， 结交 了 几 个 老 友 ， 有 了 一 
段 足 以 吹牛 皮 的 经 历 。 


第 八 年 (2011 年 2012 年 ) 
2013 年 的 第 一 场 雪 (2013 年 1 月 3 日 ， 杭 州 ) 来 得 比 以 往 更 早 一 
些 ， 那 天 下 了 一 天 的 雪 ， 我 就 知道 第 二 天 没 法 开车 上 班 了 ， 决 定 去 等 
公交 车 ， 结 果 等 了 半 个 小 时 挤 不 上 去 ， 我 就 打算 徒步 去 上 班 。 想 想 8 公 
里 路 的 路 程 ， 准 备 试 试 ， 但 走 了 两 公里 之 后 ， 我 就 走 不 动 了 ， 于 是 负 
进 路 边 的 星巴克 ， 打 开 电 脑 ， 领 导 在 网 络 那 头 说 要 写 一 下 去 年 的 总 
结 ， 我 就 好 好 总 结 一 下 吧 。 

2012 年 可 以 用 百 转 千 回 来 形容 ， 在 阿里 巴巴 ， 你 永远 无 法 预料 下 
个 季度 你 在 做 什么 。2011 年 淘宝 网 一 拆 为 四 ， 变 成 了 淘宝 、 天 猫 、 一 
淘 和 聚 划算 ， 我 成 了 阿里 巴巴 集团 的 人 ， 从 业务 部 门 变 成 了 HR。2012 
年 年 初 ， 马 总 提出 了 “One Company” 的 概念 ， 要 把 集团 内 的 资源 打通 ， 
很 多 老板 来 回转 岗 ， 很 多 业务 也 统一 整合 ， 于 是 我 的 老板 换 了 ， 老 板 
的 老板 也 换 成 了 HR 的 副 总 裁 。 但 老板 上 任 之 后 ， 刚 刚 请 我 们 吃 了 一 顿 
饭 ， 又 换 了 一 个 老板 。 新 老板 是 一 个 有 策略 的 人 ， 他 不 像 其 他 新 老板 
一 样 先 来 三 把 火 ， 而 是 三 个 月 内 不 点 任何 火 ， 只 是 不 停 地 带 我 们 吃 
饭 ， 观 察 我 们 做 事 的 状况 。 


在 这 样 的 状况 下 ， 其 实 我 们 自己 也 在 不 断 地 寻求 变化 ， 本 来 技术 
大 学 、 运 营 大 学 、 产 品 大 学 刚 合 并 疫 多 久 ， 我 们 也 经 常 相互 切磋 学 习 
方式 的 创新 。 我 们 认为 线 下 培训 的 方式 只 是 我 们 的 第 一 版 产品 ， 随 着 
公司 规模 的 扩大 、 办 公 地 点 的 继续 分 散 ， 这 个 成 本 会 越 来 越 高 ， 最 经 
典 的 是 在 每 年 七 八 月 的 时 候 ， 能 够 顶 着 烈日 走 到 一 千 米 外 的 另 一 幢 楼 
里 上 课 都 需要 很 大 的 勇气 。 还 有 一 个 问题 是 随 着 业务 的 拆 拆 合 合 ， 每 
个 业务 对 培训 的 需求 是 不 一 样 的 ， 统 一 集团 层面 的 线 下 培训 无 法 满足 
小 团队 自身 业务 的 学 习 需 求 。 

那么 我 们 的 2.0 版 本 的 产品 应 该 是 什么 呢 ? 我 们 认为 应 该 是 在 线 学 
习 ， 在 线 学 习 是 一 个 说 起 来 简单 、 做 起 来 很 有 难度 的 事情 ， 在 线 学 习 
大 概 有 四 种 模式 : 视频、 文档、 直播、 问答。 视频 要 解决 拍摄 的 清晰 
度 和 声音 的 纯净 度 的 问题 ， 在 一 般 的 教室 里 拍摄 的 视频 ， 通 常 是 投影 
幕布 很 亮 ， 人 物 黑 平平 的 ， 窗 外 的 汽车 喇叭 声 、 乌 叫 声 很 嘲 杂 ， 要 是 
讲师 在 白板 上 写 几 个 字 ， 镜 头 还 需要 移动 拉 伸 ， 这 对 器 材 、 环 境 和 报 
影 师 的 要 求 都 很 高 。 我 们 和 集团 的 “淘宝 天 下 ”团队 合作 ， 借 用 他 们 的 
器 材 ， 学 习 他 们 的 拍摄 技术 ， 现 在 拍摄 的 视频 效果 已 经 超越 家 用 DV 
了 ， 呵 呵 。 在 线 文档 的 难度 不 在 于 产生 内 容 ， 而 在 于 内 容 的 吸引 力 ， 
PPT 很 难 承载 有 实质 内 容 的 东西 ，PDEF 太 长 的 话 又 没有 人 看 。 视 频 直 播 
我 们 和 淘 花 网 合作 ， 用 在 线 Flash 播 放 的 技术 ， 这 个 相对 而 言 比较 成 
熟 ， 但 也 受 限于 摄影 机 、 教 室 环 境 等 硬件 因素 。 间 答 模 式 是 我 们 模仿 
“ 知 乎 "的 作品 ， 即 通过 学 员 主 动 提 问 ， 邀 请 同事 回答 的 方式 来 营造 一 
个 学 习 社 区 ， 这 个 难度 主要 是 早期 种 子 用 户 的 培养 和 优质 内 容 的 推 
送 。 

虽然 困难 重重 ,但 大 家 取得 一 致 的 认可 之 后 ， 我 们 就 开始 推动 这 
些 事情 了 。 培 训 管 理 员 小 寻 娘 开始 学 习 操作 专业 的 摄影 机 ， 拍 摄 完毕 
还 要 做 视频 编辑 ， 投 入 了 非常 大 的 精力 。2012 年 半年 就 上 传 了 30 多 门 
课程 的 视频 (基本 上 拍摄 和 制作 一 部 视频 至 少 需 要 两 天 时 间 ) 。 在 线 
文档 模块 中 ， 我 们 有 集团 内 最 活跃 的 知识 管理 狂热 分 子 ， 他 一 个 人 就 
上 传 了 几 千 份 文档 。 视 频 直 播 主要 还 处 于 试用 的 阶段 ， 在 重要 的 课程 
上 ， 我 们 开通 了 所 有 的 员工 可 以 在 线 观 看 的 直播 通道 ， 这 些 重要 的 课 
程 包括 正祥 、 毕 立 、 褚 霸 等 人 的 最 新 研究 。 问 答 频 道 在 “问题 少女 ?小 
组 的 运营 下 ， 也 出 现 了 不 少 优质 内 容 ， 还 有 “元 芳 你 怎么 看 ”等 颇具 社 
区 氛围 的 内 容 。 


这 些 新 的 学 习 方 式 的 探索 是 一 个 长 期 的 过 程 ， 搭 建 一 个 平台 很 容 
易 ， 上 传 很 多 内 容 也 不 难 ， 最 重要 的 是 坚持 维护 其 中 的 内 容 和 及 时 更 
新 有 效 信息 ， 我 相信 只 要 保持 这 种 热情 和 精力 的 投入 ， 在 线 学 习 的 平 
台 未 来 能 够 发 挥 出 比 线 下 培训 更 大 的 作用 。 说 到 这 里 ， 顺 便 提 一 个 概 
知识 管理 ， 我 不 太 认 同 这 个 概念 ， 在 传统 行业 ， 知 识 或 许可 以 
管理 ， 但 在 互联 网 企业 里 ， 知 识 的 更 新 迭代 非常 频繁 ， 等 你 理 出 来 刚 
要 管 的 时 候 ， 它 已 经 失效 了 。 我 认为 互联 网 行业 的 知识 不 是 要 去 管理 
的 ， 而 是 要 让 隐 性 的 知识 显 性 化 ， 在 它 的 生命 周期 里 迅速 传播 出 去 。 
我 们 不 需要 等 它 沉淀 ， 只 需要 让 足够 多 的 知识 流动 起 来 ， 就 能 创造 巨 
大 的 价值 。 

老板 一 边 和 我 们 探讨 新 的 学 习 方 式 ， 一 边 开始 响应 “One Company” 
的 号 召 ， 打 通 集团 内 部 的 培训 业务 ， 我 们 团队 的 三 个 大 学 出 自 淘宝 
网 ， 另 外 ，B2B 和 支付 宝 也 包含 “百年 技术 大 学 ”， 在 技术 大 学 下 面 也 有 
应 届 生 培训 、 在 职 培训 等 多 个 产品 。 我 们 这 些 大 学 之 间 有 些 “ 民 间 ” 的 
沟通 ， 但 从 来 没有 打通 过 资源 ， 也 没有 公用 过 一 个 平台 ， 可 以 说 是 各 
自 为 战 ， 现 在 都 <One Company” 了 ， 自 然 也 要 打通 一 下 。 于 是 在 老板 来 
了 三 个 月 后 ， 我 们 启动 了 一 个 “小 三 通 * 和 一 个 “大 三 通 * 项 目 ， “小 三 通 ” 
就 是 培训 资源 的 打通 ， 包 括 课程 、 讲 师 、 解 决 方案 的 互通 有 无 ;“ 大 三 
通 ” 是 培训 平台 的 打通 ， 培 训 的 资源 放 进 同一 个 平台 里 。 我 任 * 小 三 通 ” 
项 目的 PM、 苏 苏 〈 就 是 《人 人 都 是 产品 经 理 》 的 作者 苏 杰 ) 任 “ 大 三 
通 * 项 目的 PM。 

于 是 在 2012 年 这 个 春 夏 之 交 的 时 节 ， 我 们 “两 岸 三 地 ”( 钱 塘 江 两 
岸 ， 以 及 B2B、 支 付 宝 、 淘 宝 三 地 ) 的 培训 人 员 开 始 了 “三 通 ” 的 工作 ， 
记 不 得 开 了 多 少 轮 的 会 议 ， 在 即将 结束 的 时 候 ， 变 化 又 来 了 一 一 2012 
年 6 月 20 日 ，B2B 退 市 ， 分 拆 成 CBU 和 ICBU， 原 B2B 的 技术 大 学 并 入 集 
团 ， 于 是 从 组 织 结构 上 直接 就 “ 通 * 过 来 了 ， 人 都 在 一 起 了 。 

“在 一 起 ”之 后 ， 就 到 了 火热 的 夏天 ， 关 于 HR 的 另 一 项 重大 项 目 开 
始 启动 了 ， 就 是 招聘 。 我 一 边 帮 招聘 的 姑娘 们 审核 宣讲 稿 的 内 容 ， 一 
边 接 手 了 一 个 很 洋气 的 项 目 * 常 春 蕨 计划 ”。 这 个 计划 的 主要 思路 就 
是 ， 未 来 我 们 只 招 最 优秀 的 学 生 ， 这 些 学 生 要 培养 成 技术 上 的 “高 富 
帅 ”*。 那 怎么 培养 这 些 学 生 呢 ? 以 前 我 们 的 成 长 方式 都 是 野 路 子 ， 放 养 
在 那里 ， 长 成 什么 样 是 什么 样 。 我 们 就 想 这 些 野 路 子 里 长 出 来 的 人 有 
没有 什么 共性 呢 ? 于 是 就 寻访 了 一 批 进步 比较 快 的 员工 ， 问 他 、 问 他 
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老板 、 问 他 同事 ， 找 出 了 他 们 成 长 的 规律 ， 按 照 这 些 规律 制定 了 一 个 
新 员工 培养 的 方案 ， 这 就 是 "常春 茧 计划 ”， 这 个 计划 比较 机 密 ， 在 此 
就 不 公开 具体 内 容 了 。 

“常春 藤 计 划 ” 折 腾 出 来 之 后 ， 已 经 到 了 2012 年 秋天 ， 负 责 集团 内 
部 创新 项 目 “赛马 "的 姑娘 也 归 到 了 我 这 边 ， 她 负责 “赛马 "的 整体 安排 ， 
我 给 她 打 打 下 手 ， 偶 尔 替 补 一 下 评委 ， 也 为 集团 的 技术 创新 和 业务 创 
新 出 了 一 把 力 。 跟 进 了 三 个 月 之 后 有 一 些 感受 ， 不 管 是 外 部 创业 还 是 
内 部 创新 ， 都 面临 着 九 死 一 生 的 压力 ， 有 想法 没 用 ， 要 有 产品 出 来 ， 
甚至 有 产品 还 不 够 ， 要 能 够 迅速 推 向 市 场 。 内 部 创新 也 面临 着 被 抄袭 
的 危险 ， 同 时 还 面临 着 “官方 "产品 的 竞争 。 

写 了 这 么 多 ， 其 实 发 现 这 些 事情 我 都 是 作为 一 个 参与 者 或 者 支持 
者 在 做 ， 这 一 年 下 来 做 的 事情 很 杂 ， 多 数 事情 让 别人 作为 主力 就 可 以 
做 好 。 我 自己 在 支持 这 些 事情 的 过 程 中 倒是 有 些 副产品 取得 了 出 平 意 
料 的 效果 ， 为 了 帮 有 问答 产 品 做 支持 ， 有 一 段 时 间 整 天 混 “ 知 平 "网 ， 在 
上 面 回答 了 几 个 问题 ， 居 然 进 入 了 “「 千 人 赞 ] 俱乐部 "， 跻 身 知 平 TOP 
250 ( 黄 继 新 语 ) ; 业余 时 间 整 理 了 这 几 年 淘宝 的 技术 发 展 ， 被 新 浪 博 
客 推荐 到 IT 头条 ， 而 且 居然 有 很 多 出 版 社 联系 我 出 书 了 。 

2012 年 的 最 后 一 个 月 ， 我 一 直 在 思索 一 个 问题 ， 在 技术 人 员 的 成 
长 方面 ， 我 还 能 贡献 多 少 力量 ? 答案 让 我 有 点 失落 ， 我 离开 一 线 岗位 
三 年 了 ， 以 前 那些 技术 和 知识 也 整理 出 来 普及 到 大 家 了 ， 对 于 学 习 模 
式 的 探索 也 有 些 眉目 了 ， 这 方面 有 同事 继续 做 下 去 就 没有 问题 。 如 果 
我 是 一 段 木柴 的 话 ， 在 这 方面 已 经 燃烧 得 差不多 了 ， 那 我 就 翻 一 面 来 
烧 吧 。 这 三 年 错过 了 “去 计算" “大 数据 ”等 技术 ， 也 与 淘宝 上 的 商业 渐 
行 渐 远 ， 我 想 在 这 些 方面 补 补课 。 而 就 在 我 思索 这 些 问题 的 时 候 ， 天 
猫 聚 石塔 的 副 总 裁 菲 青 来 找 我 了 ， 呵 呵 ， 聚 石塔 里 面 有 我 想 要 的 一 
切 。 

今天 (2013 年 1 月 4 日 ) 本 来 是 我 去 聚 石塔 报到 的 第 一 天 ， 却 被 大 
雪 封 在 了 星巴克 ， 我 就 打开 电脑 在 这 里 总 结 过 去 ， 展 望 未 来 吧 。 


@ 子 柳 
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前 面 讲 述 了 技术 和 业务 是 怎么 互相 促进 、 共 生发 展 的 。 与 此 类 
似 ， 企 业 和 个 人 也 是 这 样 一 个 关系 : 一 个 水 平 很 高 的 人 ， 找 不 到 合适 
的 平台 ， 就 难以 发 挥 自己 的 价值 ， 一 个 途 勃发 展 的 企业 ， 找 不 到 合适 
的 人 才 ， 其 前 景 也 会 堪忧 。 笠 运 的 是 ， 在 淘宝 网 蓬勃 发 展 的 过 程 中 ， 
出 现 了 一 大 批 业内 顶尖 的 高 手 ， 他 们 推动 了 淘宝 的 发 展 ， 淘 宝 也 让 他 
们 实现 了 个 人 的 价值 。 接 下 来 让 我 们 一 起 看 看 那些 人 、 那 些 事 。 

正明 一 一 集团 核心 系统 高 级 研究 员 

正祥 淘宝 高 级 研究 员 ，OceanBase 项 目 负责 人 

毕 玄 一 一 集团 核心 系统 资深 技术 专家 


放 翁 一 一 淘宝 开放 平台 项 目 负责 

吴 翰 清 一 一 阿里 云集 团 信息 安全 中 心 高 级 安全 专家 
云 铮 一 数据 平台 与 产品 部 资深 技术 专家 

小 马 一 一 淘宝 UED 前 端 通用 平台 高 级 技术 专家 


淘宝 传奇 工程 师 多 隆 的 程序 世界 
正明 一 一 集团 核心 系统 高 级 研究 员 


正明 是 集团 核心 系统 研发 负责 人 ， 高 级 研究 员 。 为 2012 年 “大 淘宝 
技术 委员 会 ”会 长 ， 毕 业 于 国防 科学 技术 大 学 计算 机 专业 ， 工 学 博士 ， 
曾 任 TelTel 首 席 科 学 家 ， 国 防 科技 大 学 计算 机 学 院 副教授 ，RedHat 内 
核 开 发 者 ，LVS 开源 软件 创始 人 ，ChinaCluster 的 共同 创办 者 。 

子 柳 : 首先 恭喜 你 当选 今年 〈2012 年 ) “淘宝 技术 委员 会 ”的 会 
长 。2012 年 将 是 技术 委员 会 运营 的 第 三 年 ， 在 年 会 上 也 有 一 些 委员 疑 
惑 的 声音 ， 例 如， 技术 委员 会 是 一 个 虚拟 的 组 织 ， 没 有 调动 资源 的 权 
利 ， 很 难 主导 一 些 工作 之 外 的 技术 创新 ， 作 为 本 届 会 长 ， 你 对 这 些 声 
音 有 什么 看 法 ? 

正明 : 技术 委员 会 在 淘宝 成 立 有 两 年 左右 的 时 间 了 ， 发 挥 了 不 少 
积极 的 作用 ， 例 如 “Job Model" 的 编写 “晋升 考核 " “技术 赛马 ? 活 
动 、“ 淘 宝 开源 ”等 ， 技 术 委 员 会 确实 做 了 一 些 事情 。 可 能 我 们 宣传 得 
比较 少 ， 呵 呵 。 有 人 提 到 去 年 〈2011 年 ) 有 个 想法 ， 但 是 跟 业 务 线 的 
关系 不 大 ， 他 去 找 那 些 主管 ， 却 要 不 到 资源 。 其 实 像 去 年 无 锋 做 的 “ 技 
术 赛 马 ”活动 中 的 “taobao labs” 项 目 ， 他 也 不 是 一 个 人 做 的 ， 他 找 了 好 
几 个 人 ， 是 跨 团队 的 。 那 时 技术 委员 会 也 出 面 ， 获 得 了 菲 青 的 支持 ， 


把 外 边 的 人 员 放 进来 ， 这 样 “taobao labs” 得 到 了 很 好 的 开展 。 其 实 技术 
委员 会 是 除了 业务 线 之 外 的 一 个 额外 的 渠道 ， 在 这 里 你 能 讲 你 的 想 
法 ， 拿 到 资源 。 可 能 这 方面 我 们 宣传 不 够 ， 很 多 技术 小 二 不 太 知道 。 
2012 年 我 们 要 在 这 方面 多 宣传 一 下 ， 包 括 提 升 技术 委员 会 在 整个 技术 
小 二 中 间 的 影响 力 ， 例 如 ， 它 有 哪些 作用 ， 有 哪些 功能 等 。 

子 柳 : 技术 团队 在 去 年 被 分 离 成 了 几 个 部 分 ， 但 是 技术 应 该 还 是 
一 体 的 ， 在 大 淘宝 的 大 氛围 下 , “大 淘宝 技术 委员 会 ”在 其 中 担任 的 是 
怎样 一 个 角色 ? 起 什么 作用 ? 这 些 会 给 整个 淘宝 带 来 什么 影响 ? 

正明 : 公司 组 织 架构 有 不 同 的 划分 ， 这 是 业务 的 需要 。 “技术 委员 
会 "是 一 个 纽带 ， 可 以 把 各 个 组 织 架构 下 的 技术 部 门 串 在 一 起 。 “技术 
委员 会 "是 技术 人 员 的 一 个 组 织 ， 它 不 承担 一 个 具体 的 业务 线 ， 它 的 互 
动 和 学 习 的 功能 会 更 好 一 些 。 这 样 能 够 使 整个 大 淘宝 的 技术 人 员 形 成 
合力 ， 共 同 推动 淘宝 技术 的 发 展 。 

子 柳 : 作为 大 淘宝 技术 委员 会 的 新 任 会 长 ， 委 员 会 在 未 来 一 年 的 
技术 规划 有 哪些 可 以 和 小 二 分 享 呢 ? 

正明 : 这 个 规划 不 是 自 上 而 下 的 ， 而 是 技术 委员 会 的 各 个 分 会 对 
自己 的 发 展 做 规划 ， 现 在 有 7 个 分 会 ， 未 来 可 能 要 增加 一 个 “无 线 分 
会 >， 主要 由 这 些 分 会 来 做 规划 ， 自 下 而 上 的 规划 会 更 有 生命 力 。 作 为 
技术 委员 会 的 “常委 ”， 我 们 主要 的 职责 是 申请 到 更 多 的 资源 和 大 家 一 
起 设立 好 的 激励 机 制 ， 让 分 会 有 更 多 创新 的 想法 ， 更 自主 、 自 发 地 开 
展 工 作 。 技 术 总 会 上 我 们 也 会 策划 对 内 对 外 的 交流 平台 ， 例 如 ， 技 术 
委员 会 的 开放 日 ， 我 们 还 会 搭建 技术 委员 会 的 网 站 ， 开 展 内 部 交流 活 
动 〈 例 如 * 空 享 会 2” ， 每 个 分 会 有 自己 的 发 展 基金 , “技术 委员 会 "也 
设立 一 些 奖项 用 来 激励 “技术 赛马 “技术 创新 ”等 。 对 外 我 们 继续 支 
持 “ 技 术 嘉 年 华 `、 “技术 沙龙 ^ “Velocity” 等 。 

子 柳 : 你 个 人 的 技术 经 历 非常 丰富 ， 在 读 研究 生 的 时 候 就 开发 出 
了 LVS 系 统 ， 然 后 在 国防 科技 大 学 教书 ， 接 着 去 创业 ， 最 后 又 加 入 淘 
宝 网 ， 能 分 享 一 下 你 这 一 路 是 怎么 走 过 来 的 吗 ? 

正明 : 我 是 在 念 博士 的 时 候 开 始 做 的 LVS，2000 年 开始 在 国防 科 
技 大 学 教学 ，2006 年 正式 离开 大 学 了 ， 先 是 创业 了 一 段 时 间 ， 两 年 前 
加 入 淘宝 。 


我 在 1998 年 做 的 LVS 项 目 ， 到 1999 年 的 时 候 ， 基 于 这 个 项 目 已 经 
有 很 多 应 用 了 。 那 时 候 我 有 个 同学 在 上 海 ， 复 旦 大 学 有 个 MBA 的 创业 
比赛 ， 他 问 我 有 什么 想法 ， 我 就 把 LVS 这 个 项 目 给 他 描绘 了 一 下 ， 结 
果 他 拿 着 这 个 想法 去 参赛 了 ， 结 果 好 像 没 有 获奖 ， 哈 哈 。 后 来 我 们 觉 
得 既然 号 了 这 个 商业 计划 书 ， 看 着 还 有 点 机 会 ， 就 找 一 些 朋 友 看 能 不 
能 拿 到 投资 。 在 2000 年 年 初 的 时 候 ， 找 到 一 笔 种 子 基 金 ， 那 时 候 我 还 
在 学 校 里 ， 我 们 成 立 了 一 个 公司 。 当 时 正 是 互联 网 泡沫 时 期 ， 我 们 也 
没什么 经 验 ， 几 百 万 元 的 钱 我 们 一 年 就 花 完 了 。 这 就 是 我 们 第 一 次 创 
业 的 过 程 ， 其 实 创 业 要 考虑 的 事情 很 多 ， 包 括 整 个 公司 的 运作 、 现 金 
流 、 市 场 推广 等 。 

( 子 柳 : 当时 规模 有 多 大 ? ) 规模 最 大 的 时 候 有 40 多 人 ， 在 北京 
和 上 海 两 地 。 

( 子 柳 : 那 是 一 个 什么 样 的 项 目 ? ) 我 们 网 站 的 名 字 叫 
chinacluster.com， 即 中 国 集群 网 络 有 限 公 司 ， 围 绕 LVS 做 负载 均衡 的 
设备 和 技术 服务 。 

这 样 差 不 多 一 年 的 时 间 ， 公 司 关 闭 了 ， 我 还 在 学 校 教书 ， 做 科 
研 。2001 年 ， 我 结婚 了 ，2002 年 ， 我 太太 博士 毕业 了 ， 想 去 北京 ， 她 
是 校 子弟 ， 从 小 在 国防 科大 的 院子 里 长 大 ， 从 幼儿 园 一 直到 博士 没 出 
去 过 远门 ， 等 毕业 了 就 想 一 定 要 离开 这 个 地 方 。 正 好 我 有 个 同学 在 中 
科 院 软件 所 ， 我 们 学 校 派 我 跟 他 们 合作 一 个 项 目 ， 然 后 就 去 北京 了 。 
当时 我 们 看 整个 计算 机 产业 的 发 展 ， 一 开始 是 大 型 机 + 哑 终 端 ， 到 现 
在 是 个 人 计算 机 的 天 下 ， 这 可 以 说 智能 从 中 心 向 边缘 迁移 ， 导 致 新 的 
产业 格局 。 然 后 我 们 看 通信 行业 ， 当 时 整个 通信 体系 把 持 在 运营 商 手 
里 ， 终 端 只 负责 接收 和 发 送 讯 息 。 我 们 预见 通信 产业 的 智能 也 要 往 边 
缘 移 ， 网 络 的 层面 只 要 是 个 “ 笨 网 络 ” 就 可 以 ， 负 责 报 文 转发 就 行 了 
(但 目前 来 看 ， 这 个 还 是 牢 牢 控制 在 运营 商 的 手 里 ) 。 当 时 AT&T 的 
一 个 研究 人 员 研 究 了 十 几 年 的 智能 网 ， 但 后 来 他 把 自己 的 理论 颠覆 
了 ， 认 为 智能 不 应 该 在 中 心 ， 研 究 智能 网 都 是 错误 的 ， 智 能 应 该 在 终 
端 ， 我 看 了 之 后 非常 认同 。 他 这 个 理念 跟 Bell 实 验 室 的 研究 是 背 道 而 
驰 的 ， 后 来 他 被 解雇 了 。 但 我 认为 这 是 个 潮流 ， 一 定 会 发 生 的 ， 我 们 
顺势 而 为 ， 不 求 做 出 多 伟大 的 东西 ， 搭 上 这 趟 车 就 能 成 功 ， 于 是 我 们 
就 围绕 着 这 个 主题 开始 研究 。 我 们 看 到 SIP 协 议 实 际 上 是 解决 了 两 个 


Peer 〈 对 等 端 ) 之 间 通 信 的 问题 ， 借 助 一 个 Session 能 够 找到 对 方 。 这 
个 协议 跟 我 们 的 理念 是 契合 的 ， 我 们 就 研究 这 个 SIP。 但 是 现实 中 有 很 
多 家 庭 网 关 ， 它 是 私有 IP 地 址 ， 要 做 NET 地 址 翻译 才能 找到 公 网 。SIP 
协议 是 七 层 协 议 ， 不 会 考虑 到 私有 IP， 这 样 两 个 peer 都 在 私 网 中 ， 怎 
么 找到 对 方 ? NAT 穿 越 就 是 一 个 问题 。 当 时 美国 有 一 家 公司 Jasomi 能 
做 这 个 事情 ， 一 台 Jasomi 设 备 要 卖 好 几 万 美元 ， 很 贵 。 我 当时 看 了 他 
们 的 规格 ， 感 觉 也 不 是 很 难 ， 正 好 北京 非典 爆发 了 ， 我 一 个 多 月 待 在 
家 里 没 啥 事 干 ， 就 把 这 个 功能 写 出 来 了 ， 没 人 打扰 时 的 工作 效率 真 
高 。 然 后 我 们 在 硅谷 通过 思科 找到 做 SIP Proxy 的 一 个 小 公司 Cathay 
Networks ， 他 们 也 快 没 钱 了 ， 我 们 就 合伙 干 。 我 们 有 了 SIP 相 关 的 技 
术 ， 但 不 知道 拿 它 们 做 什么 应 用 。 

我 们 做 的 一 个 应 用 叫 Meet2talk， 即 聚 在 一 起 聊天 ， 相 当 于 一 个 语 
音 聊 天 室 或 电话 会 议 。 我 们 这 个 是 面向 终端 客户 的 ， 不 是 面向 企业 
的 ， 但 是 发 现 这 个 应 用 不 是 一 般 的 人 能 聊 得 起 来 的 ， 因 为 我 们 不 想 往 
娱乐 的 方向 发 展 ， 因 此 用 户 很 少 。 然 后 我 们 就 想 面 向 熟人 做 一 个 语音 
聊天 工具 ， 在 2004 年 做 了 一 个 TelTel ， 推 出 来 之 后 发 现 市 场 上 有 一 个 
Skype， 它 是 2003 年 9 月 做 出 来 的 ， 此 时 我 们 在 技术 上 也 碰 到 一 些 问 
题 ， 面 向 大 规模 用 户 的 时 候 顶 不 住 了 ， 后 来 美国 这 边 的 几 位 员工 要 离 
开 ， 那 边 就 做 不 下 去 了 。 当 时 我 在 国内 给 他 们 NAT 穿 越 的 支持 ， 同 时 
也 在 做 别 的 项 目 。2003 年 年 底 ， 我 们 在 国内 做 的 一 个 项 目 叫 比 酷 网 
(bitcool.tv) ， 该 网 允许 用 户 上 传 一 些 MP3、 视 频 、Flash 等 ， 直 接 提 
供 播 放 和 下 载 ， 当 时 没 看 到 Flash 技 术 的 巨大 价值 ， 这 些 多 媒体 文件 都 
是 用 源 格 式 播放 的 ， 流 量 很 大 ， 带 宽 的 成 本 很 高 ， 也 不 知道 流量 的 价 
值 。 由 于 付 不 起 流量 的 钱 ， 我 们 推出 了 P2P 客 户 端 软件 aBitCool， 后 来 
收 到 好 莱 坞 的 律师 水， 又 有 了 版 权 方 面 的 问题 。 〈 问 : 差点 做 出 一 个 
youtube? ) ， 就 差 那 么 一 点 ， 若 当初 坚持 下 来 就 好 了 ， 呵 呵 。 

美国 的 人 要 走 ， 我 们 就 去 接 美国 语音 通信 的 研发 ， 解 决 了 TelTel 大 
规模 用 户 的 支持 问题 ， 但 发 现 做 这 个 很 难 赚 钱 ，PC 上 大 家 习惯 了 免 
费 ， 电 话 那 一 段 掌握 在 运营 商 手 里 (包括 Skype 现 在 也 没有 赚钱 ) ， 我 
们 根本 没有 议价 能 力 。D-Link 投 资 了 我 们 一 些 ， 他 们 有 很 多 网 络 设 
备 ， 但 是 不 知道 用 户 是 怎么 用 的 ， 用 我 们 的 SIP 技 术 可 以 得 到 这 些 信 
息 。 我 们 就 跟 D-Link 人 合作， 还 做 了 SIP 电 话 、SIP 摄 像 头 、SIP 电 子 相 框 


等 ， 不 过 都 是 些小 众 的 产品 ， 也 没 卖 出 多 少 。 再 后 来 我 们 看 中 了 互联 
网 电视 ， 做 了 一 个 9X9.TV (云端 电视 ) ， 即 允许 用 户 自己 组 织 电视 节 
目 ， 自 己 做 电视 台 ， 也 可 以 订阅 别人 的 节目 ， 用 我 们 的 设备 帮 你 下 载 
内 容 ， 推 送 到 用 户 的 电视 机 上 播放 。 由 于 广电 总 局 一 纸 禁 令 不 能 将 互 
联网 的 内 容 带 到 家 里 的 电视 上 ， 最 终 我 们 这 个 项 目 在 国内 就 很 难 开 展 
J 

子 柳 : 你 到 淘宝 两 年 多 来 ， 一 开始 主要 做 LVS 和 HAproxy 的 大 规 
模 普 及 ， 之 后 做 了 很 多 CDN 系 统 的 改良 工作 ， 今 年 又 推出 
GreenCompnute 项 目 。 能 介绍 一 下 这 几 年 工作 的 整体 规划 思路 吗 ? 

正明 : 这 几 年 工作 的 整体 规划 思路 就 是 为 淘宝 网 打造 一 个 高 ' 
能 、 高 可 扩展 、 高 可 用 、 低 成 本 的 基础 平台 ， 基 本 上 是 在 这 四 个 维度 
上 不 断 深入 人 优化。 最早， 淘宝 的 CDN 用 的 是 商用 的 调度 负载 均衡 器 
Citrix NetScaler， 这 是 当时 业界 最 好 的 负载 均衡 器 。 但 是 淘宝 因为 规模 
越 来 越 大 ， 有 很 多 针对 小 图 片 方面 的 访问 需求 ， 用 Citrix 就 遇 到 很 多 问 
题 ， 小 图 片 造 成 的 请 求 数 特别 多 ， 万 焰 网 卡 的 流量 只 能 到 3GB/s, 一 
旦 流量 超过 3GB/s， 若 到 了 4GB/s， 系 统 就 会 朋 演 。 在 CDN 系 统 中 ， 图 
片 处 理 的 挑战 最 大 ， 相 比 视频 那 种 连续 的 数据 ， 图 片 这 种 很 小 的 、 比 
较 离 散 的 数据 对 硬盘 的 访问 要 求 很 高 。 淘 宝 在 2008 年 年 底 到 2009 年 年 
初 左 右 ， 曾 经 一 度 全 用 SSD， 这 样 一 个 CDN 的 节点 造价 就 会 比较 高 ， 
要 人 花 掉 两 百 万 元 左右 的 钱 ， 还 要 再 加 上 商用 的 负载 均衡 器 。 而 且 刚 才 
也 说 了 ， 一 个 NetScaler 流 量 只 能 提供 到 3GB/s， 两 人 台 加 起 来 也 就 只 有 
6GB/s， 而 且 两 个 NetScaler 还 不 敢 用 心跳 线 ， 因 为 它 虽 然 支 持 这 个 功 
能 ， 但 是 万 一 有 一 台 坏 掉 ，6GB/s 的 流量 完全 转移 到 另 一 台 ， 其 结 
肯定 会 令 人 骨 溃 。 所 以 这 就 是 商用 系统 的 问题 : 在 特别 的 负载 情况 
下 ， 它 是 不 适用 的 。 

于 是 我 们 开始 逐步 改造 。 用 LVS+HAproxy， 在 硬件 高 配 的 情况 
下 ,一 个 节点 跑 到 100GB/s 都 没 问 题 。 成 本 方面 ， 后 端 肯定 不 能 无 限 
制 地 伦 钱 ， 我 们 就 开始 用 混合 存储 ，SATIA、SAS 和 SSD 都 有 。 经 过 优 
化 之 后 ， 效 果 做 到 跟 全 SSD 差 不 多 ， 人 存储 空间 更 大 ， 命 中 率 更 高 ， 像 
我 们 现在 有 些 高 的 ， 命 中 率 可 以 做 到 98%。 那 么 现在 我 们 一 个 最 低 标 
准 的 CDN 节 点 ， 流 量 在 10GB/s， 成 本 已 经 优化 到 50 万 元 ， 如 果 是 低 功 
耗 ， 还 可 以 进一步 优化 到 37 万 元 。 这 个 项 目 我 们 以 后 还 会 持续 优化 ， 


因为 优化 无 止境 嘛 ， 我 们 追求 的 目标 是 更 好 的 用 户 体 验 ， 更 短 的 响应 
时 间 ， 同 时 还 要 花 更 少 的 钱 。 

响应 时 间 是 我 们 最 关注 的 指标 ， 因 为 它 直 接 影响 到 用 户 的 体验 。 
其 实 淘 宝 目 前 在 图 片 的 优化 方面 做 得 算 还 不 错 ， 例 如 ， 今 年 “ 双 十 二 ” 
的 时 候 ， 我 们 最 高 跑 到 了 856GB/s 的 图 片 流量 ， 这 在 世界 上 可 能 也 是 
一 个 纪录 了 。 你 现在 打开 一 个 淘宝 的 网 页 ， 图 片 加 载 的 速度 还 算 变 快 
的 ， 目 前 图 片 请 求 的 平均 响应 时 间 已 经 在 10ms 左 右 ， 但 我 们 还 会 进 一 
步 挖 掘 ， 看 能 否 达 到 9ms 或 ams 以 下 ， 让 它 加 载 得 更 快 。 虽 然 说 ， 越 往 
下 面 挖掘 ， 难 度 会 越 大 ， 但 是 这 也 是 值得 去 做 的 。 

另 一 方面 ， 网 络 传输 这 方面 往往 也 是 瓶颈 。 一 个 图 片 请 求 发 过 
来 ， 硬 盘 的 处 理 时 间 算 为 10ms， 但 是 在 网 络 传输 方面 ，CDN 部 署 的 好 
的 情况 可 能 会 占用 20ms， 如 果 网 络 有 问题 ， 就 可 能 到 70ms、80ms。 所 
以 ， 网 络 协议 的 优化 方面 ， 可 以 挖掘 的 空间 可 能 会 更 大 。 

2009 年 年 底 ， 我 们 立项 要 做 低 功 耗 的 项 目 ， 选 择 了 当时 我 们 掌控 
比较 好 的 CDN 系 统 。 因 为 CDN 对 数据 的 安全 性 要 求 不 是 太 高 ， 毕 竟 上 
面 都 是 缓存 ， 数 据 丢 了 也 无 妨 ， 全 局 系统 可 以 随时 把 坏 掉 的 节点 切 
掉 ， 对 用 户 的 影响 低 ， 所 以 这 个 低 功 耗 服务 器 就 专门 针对 CDN 应 用 进 
行 定 制 。 这 中 间 经 历 了 很 多 事情 ， 整 个 过 程 并 不 是 很 顺利 ， 最 终 成 功 
弄 出 来 ， 也 要 感谢 很 多 参与 的 厂商 ， 像 威盛 、Intel， 还 有 超 微 。 总 
之 ， 我 们 最 终 还 是 把 这 个 基于 Atom 的 服务 器 用 起 来 了 ， 而 且 性 能 优化 
效果 与 其 他 的 Intel 处 理 器 相 比 ， 目 前 是 最 好 的 。 其 实 低 功 耗 服务 器 在 
整个 绿色 计算 中 只 是 一 个 小 环节 ， 服 务 器 还 包含 高 性 能 服务 器 ， 服 务 
器 之 外 还 有 网 络 设备 、 机 架 、 直 流 供电 的 电源 ， 到 整个 数据 中 心 的 设 
计 ， 都 应 该 是 绿色 计算 的 范畴 。 而 且 我 们 现在 定制 的 只 是 一 款 Atom 
D525 的 机 器 ， 实 际 上 ， 低 功 耗 也 可 以 有 很 多 款 机 器 。 所 以 ， 现 在 我 们 
做 的 只 是 其 中 很 小 一 部 分 ， 把 它 分 享 出 来 ， 也 是 希望 大 家 都 能 参与 进 
来 ， 尤 其 是 也 在 关注 绿色 数据 中 心 的 互联 网 企业 。 如 果 大 家 都 能 参与 
进来 ， 对 业界 会 是 一 个 很 好 的 促进 。 我 们 现在 跟 业界 同仁 已 经 在 联系 
这 方面 的 事情 ， 目 前 正在 进展 中 。 

子 柳 : 是 什么 机 缘 来 到 淘宝 的 ? 

正明 : 我 在 前 些 年 其 实 做 得 很 累 ， 不 断 地 试验 很 多 新 想法 ， 商 业 
的 成 果 很 难 如 预期 。 有 时 候 有 了 不 错 的 技术 ， 却 不 一 定 能 找 得 到 用 


户 ， 这 很 难 创造 什么 社会 价值 。 而 淘宝 的 社会 价值 是 显而易见 的 ， 系 
统 的 规模 和 挑战 摆 在 那里 ， 技 术 问 题 很 快 就 能 给 用 户 带 来 价值 。 我 在 
2007 年 到 杭州 参加 过 一 次 网 侠 大 会 ， 后 来 一 直 有 人 跟 我 联系 ， 我 手 上 
那些 项 目 结束 之 后 ， 在 家 内 了 一 段 时 间 就 过 来 了 。 

子 柳 : 你 预测 一 下 未 来 的 淘宝 网 系统 会 有 哪些 挑战 ? 

正明 : 未 来 规模 的 挑战 会 更 大 ， 数 据 的 存储 系统 、 中 间 件 、CDN 
的 存储 系统 ， 在 规模 上 来 之 后 ， 这 些 架构 都 要 重新 思考 。 像 CDN 现 在 
已 经 有 1000GB/s 了 ， 未 来 达到 3000GB/s 或 更 大 的 时 候 ， 在 不 影响 用 户 
体验 的 前 提 下 ， 如 何 降低 带宽 的 成 本 ， 是 不 是 要 建 不 同 规模 的 CDN 节 
点 ， 之 间 是 不 是 要 有 点 层次 关系 等 。 在 后 端的 数据 层 ， 如 我 们 的 
Hadoop 集 群 真 的 到 了 10000 台 机 器 时 该 怎么 处 理 ? 很 多 东西 都 需要 重 
新 思考 。 

子 柳 : 你 一 直 活 跃 于 开源 社区 ， 你 觉得 我 们 从 开源 社区 获得 了 什 
么 帮助 ， 我 们 又 为 开源 社区 贡献 了 多 少 ? 

正明 : 我 们 从 开源 社区 得 到 的 帮助 太 大 了 。 例 如 ， 我 们 去 年 要 提 
高 数据 库 的 性 能 ， 影 响 数 据 库 性 能 的 一 个 重要 因素 是 存储 的 1/O 速 度 。 
2010 年 夏天 ， 褚 霸 和 我 们 一 起 看 最 快 的 非 易 失 性 存储 产品 ， 就 是 掉 电 
也 不 丢 数 据 的 。 我 们 联系 了 国外 做 PCI-E 的 Flash 卡 存储 的 两 家 厂商 ， 
测试 了 6 个 月 ， 效 果 很 好 。 伏 威 的 团队 先 在 IC 上 把 IBM 小 型 机 去 掉 ， 换 
上 高 端的 PC 服务 器 。 然 后 我 们 帮 着 一 起 把 存储 换 成 PC 服务 器 加 PCI-E 
存储 ， 也 对 数据 库 做 了 五 六 层 的 优化 ， 从 innoDB 的 存储 引擎 到 IO 的 调 
度 器 ， 再 到 Flash Cache 和 对 文件 系统 进行 调 优 。 这 样 我 们 换 掉 了 
Oracle， 去 掉 了 EMC 的 存储 ，IC 上 去 后 效果 很 好 。 到 TC 的 时 候 ， 一步 
就 把 IOE (IBM 小 型 机 、Oracle、EMC 存 储 ) 替换 掉 了 。 淘 宝 在 2010 年 
的 时 候 ， 每 秒 钟 仅 有 2000 笔 交易 ，2011 年 原 定 目标 是 5000 笔 交易 ， 换 
成 PC 服务 器 加 PCI-E 的 卡 之 后 ， 一 台 机 器 就 可 以 做 10000 笔 交易 。 过 去 
的 解决 方案 要 花费 2000 万 元 ， 现 在 一 台 花 费 12 万 元 就 可 以 了 。 为 了 保 
险 起 见 ， 我 们 放 了 一 个 16X2 的 集群 ， 也 只 花费 400 万 元 就 够 了 。 在 
TDDL 层 拆 分 之 后 ， 单 从 数据 库 来 说 ， 一 秒 钟 可 以 做 160000 笔 交易 ， 
这 可 以 撑 起 淘宝 未 来 很 多 年 的 发 展 。 去 掉 IOE 的 成 功 ， 这 对 淘宝 来 说 
是 一 个 标志 性 的 事件 。 我 们 最 核心 的 系统 已 经 摆脱 了 商用 软件 ， 完 全 


基于 开 产 软件 和 目 主 开发 的 软件 系统 ， 所 以 说 ， 开 源 软 件 对 我 们 帮助 
非常 大 。 

我 们 现在 也 把 我 们 自己 的 一 些 软件 开源 出 来 ， 回 馈 社 区 ， 包 括 
TFS、Tair、WebX、TEngine 等 。 我 们 的 淘 师 昨 平 台 上 已 经 有 了 一 百 多 
个 开源 项 目 ， 这 些 项 目 不 仅 是 淘宝 工程 师 的 ， 也 有 很 多 是 外 面 的 工程 
师 贡献 的 。 我 相信 国内 的 开源 环境 会 越 来 越 好 。 

子 柳 : 你 对 刚 入 行 的 技术 人 员 有 什么 建议 ? 

正明 : 找到 自己 感 兴趣 的 ， 从 时间 投 进去 ， 通 过 实践 后 的 知识 积 
累 比 只 看 书本 有 用 得 多 。 我 看 过 一 本 操作 系统 方面 的 英文 书 ， 其 中 引 
用 了 一 段 中 国人 的 格言 :“I hear and I forget.I see and I rememberI do 
and I understand”， 这 人 句 话 给 我 留 下 非常 深刻 的 印象 。 是 荀子 说 的 “不 
闻 不 若 闻 之 ， 闻 之 不 若 见 之 ， 见 之 不 若 知 之 ， 知 之 不 若 行 之 。” 

子 柳 : 你 在 工作 上 一 直 很 已 ， 我 也 看 到 你 经 单 在 微 博 上 秀 生 活 
照 ， 能 描述 一 下 你 业余 时 间 是 什么 样子 的 吗 ? 

正明 : 主要 是 带 孩 子 玩 ， 我 比较 喜欢 孩子 ， 当 然 家 里 的 事 不 是 我 
做 主 ， 我 主要 负责 陪 玩 ， 呵 呵 。 

子 柳 : 感谢 正明 抽出 宝贵 时 间接 受 我 们 的 采访 ， 从 正明 这 一 路 走 
过 来 看 ， 总 的 感觉 就 是 “技术 驱动 人 生 ”， 正 明 已 经 把 技术 融 进 了 骨 子 
里 6 


正祥 一 淘宝 高 级 研究 员 ，OceanBase 项 目 
负责 人 
他 曾 拥有 众多 响亮 的 名 头 ， 他 没有 下 属 ， 但 却 做 着 令 人 高 山 仰 止 


的 事情 ， 他 笑称 自己 “ 没 品 位 ”。 下 面 让 我 们 一 起 去 慢 慢 品味 这 位 技术 
大 侠 一 一 正祥 。 


阳 振 坤 博士 (淘宝 花 名 正祥 ) ， 中 国 计 算 机 学 会 YOCSEF 荣 誉 委 
员 。1984 年 进入 北京 大 学 ， 大 学 只 用 了 三 年 ， 硕 士 只 用 了 一 年 多 ，24 
岁 成 为 王选 的 博士 生 。1997 年 破格 晋升 为 教授 ，1999 年 成 为 北京 大 学 
首 批 * 长 江 学 者 奖励 计划 ”特聘 教授 之 一 ， 先 后 获得 北京 市 科学 技术 进 
步 奖 一 等 奖 、 国 家 科学 技术 进步 奖 一 等 奖 (排名 第 四 ) 、 第 六 届 中 国 
青年 科技 奖 、 北 京 市 五 四 青年 奖 等 。 曾 先后 担任 方正 研究 院 副 院 长 、 
北大 计算 机 研究 所 副 所 长 、 联 想 研 究 院 首席 研究 员 、 微 软 亚洲 研究 院 
主任 研究 员 、 百 度 高 级 科学 家 等 。 现 担任 淘宝 高 级 研究 员 。 

这 样 的 名 头 足 以 叱 听 江 湖 ， 也 许 你 脑海 中 会 浮现 出 某 位 成 功 可 以 
复制 的 人 或 者 某 位 人 生 导 师 的 形象 。 但 见 到 他 的 那 一 刻 ， 你 脑海 中 的 
形象 就 会 被 颠覆 。 运 动 鞋 、 宽 松 的 休闲 裤 、 略 有 走 形 的 衬衣 ， 和 斜 挂 着 
工 牌 。 瘦 高 ， 眼 神 清 静 ， 说 起 话 来 总 带 着 谦 鼻 的 笑容 。 他 就 是 正祥 
一 一 阳 振 坤 。 很 多 人 对 他 的 着 装 风格 印象 深刻 ， 仰 慕 他 的 潇洒 不 团 ， 
他 却说 ， 那 是 因为 他 * 没 品位 >， 让 大 家 别 学 习 这 点 。 


这 位 * 没 品位 ”的 大 侠 却 在 做 着 令 人 高 山 仰 止 的 事情 ， 他 成 功 地 主 
持 研制 了 方正 第 六 代 和 第 七 代 RIP (光栅 图 像 处 理 器 ) ， 为 我 国 新 闻 
出 版 事业 做 出 不 可 替代 的 贡献 。 中 科 院 院士 、 北 大 方正 科技 研究 院 院 
长 王选 教授 这 样 评 价 他 :“ 阳 振 坤 研制 了 我 国 第 一 个 页 面 语言 解释 器 ， 
在 新 一 代 RIP 的 总 体 设计 、 软 件 结构 、 关 键 算 法 等 方面 做 出 了 关键 性 
贡献 >。 而 今 ， 他 在 淘宝 主持 研发 海量 数据 库 OceanBase 
(oceanbase.taobao.org) 。 淘 宝 的 数据 已 经 远 远 超过 了 单个 关系 数据 
库 所 能 支撑 的 最 大 规模 ， 而 且 仍 然 在 快速 增长 之 中 。 对 淘宝 来 说 ， 研 
发 海量 数据 库 已 经 不 仅仅 是 出 于 成 本 的 考虑 ， 如 果 不 采 取 这 些 技术 ， 
可 能 很 快 会 因为 机 房 数 量 、 成 本 等 无 法 支撑 下 去 。 

面 对 这 些 世 界 级 的 难题 ， 正 祥 研 究 得 怎么 样 了 ? 这 样 一 位 牛人 ， 
他 身上 有 什么 传奇 的 经 历 ? 他 对 年 轻 人 的 成 长 有 什么 建议 ? 他 身上 又 
有 哪些 八卦 消息 呢 ? 

带 着 这 些 问 题 ， 我 对 他 进行 了 一 次 采访 ， 采 访 的 开头 有 一 个 很 有 
意思 的 细节 ， 正 祥 带 着 一 个 空 的 矿泉 水 瓶 ， 自 己 去 饮水 机 那里 打 了 一 
瓶 水 ， 放 在 脚 边 。 

子 柳 : 茶 喜 你 ， 你 主导 的 OceanBase 刚 刚 获 得 本 届 中 日 韩 开 产 软 件 
竞赛 优胜 奖 ， 这 个 奖项 的 意义 是 什么 ? 

正祥 : 这 是 三 个 国家 信息 产业 部 联合 组 织 的 开源 软件 的 一 个 促进 
会 议 (第 十 届 东 北 亚 开源 软件 推进 论坛 ) ， 奖 项 是 “第 六 届 中 日 韩 开源 
软件 技术 优胜 奖 *， 我 们 国家 有 三 个 软件 获奖 ， 都 是 企业 做 的 ， 淘 宝 
OceanBase 排 在 第 一 。 

子 柳 : OceanBase 主 要 是 为 了 解决 什么 问题 ? 

正祥 : 关系 型 数据 库 理论 的 成 熟 在 20 世 纪 六 七 十 年 代 ， 技 术 和 产 
品 的 成 熟 是 在 20 世 纪 七 八 十 年 代 ， 从 成 熟 到 现在 ， 它 的 技术 和 理论 没 
有 太 大 的 突破 。 但 实际 上 ， 需 求 是 在 一 直 变 化 的 ， 今 天 的 数据 规模 对 
关系 数据 库 提出 了 严峻 的 挑战 。 最 近 ， 很 多 企业 开始 做 NoSQL 的 系 
统 ， 其 实 这 个 NoSQL 可 以 说 “No SQL” 或 者 “Not Only SQL”， 我 更 倾向 
于 叫 后 者 ， 咱 不 能 否定 SQL。 我 们 要 解决 的 问题 是 数据 规模 的 问题 ， 
数据 库 本 质 上 是 一 个 单机 系统 ， 即 便 是 做 了 分 库 分 表 ， 这 些 也 没有 改 
变 的 是 单机 系统 的 本 质 。 单 机 系统 导致 它 的 数据 规模 和 处 理 能 力 都 会 
有 一 定 的 限制 ， 你 要 提升 这 些 ， 只 能 用 更 好 的 服务 器 小 型 机 、 中 


型 机 、 大 型 机 ， 它 的 成 本 上 百倍 地 增长 ， 但 性 能 却 没有 跟 成 本 一 样 提 
升 ， 性 价 比 很 低 。 而 淘宝 的 数据 规模 已 经 到 了 这 个 关口 。 

打破 这 个 瓶颈 ， 分 布 式 的 系统 是 一 个 选择 ， 这 方面 的 大 规模 应 用 
最 早 是 由 Google 开 始 做 的 ， 但 我 们 的 需求 跟 他 们 有 一 个 不 同 的 地 方 : 
搜索 引擎 可 能 索引 不 到 一 些 页 面 ， 也 可 能 索引 到 一 些 页 面 的 速度 较 
慢 ， 但 淘宝 是 从 事 电 子 商务 的 ， 用 户 的 商品 、 交 易 都 不 能 遗漏 和 出 
错 ， 页 面 的 展示 要 尽 可 能 地 快 ， 我 们 需要 更 高 的 数据 一 至 性， 也 需要 
存 取 速度 更 快 的 数据 库 。 

因此 ， 我 们 要 解决 的 问题 就 是 在 淘宝 的 数据 规模 不 断 增长 的 情况 
下 ， 提 供 高 容量 、 低 成 本 、 高 一 致 性 、 高 可 靠 的 数据 存储 和 访问 服 
务 。 

子 柳 : 网 友 喜 鹏 -wugu123 问 ， 传 统 的 天 系 型 数据 库 的 数据 规模 受 
到 制约 的 主要 原因 是 什么 ? 

正祥 : 关系 数据 库 的 数据 规模 受 限 的 根本 原因 是 目前 的 关系 数据 
库 尽 管 有 各 种 方式 的 扩展 ， 但 本 质 上 是 单机 系统 。 

子 柳 : OceanBase 是 什么 时 候 开 发 完毕 的 ， 现 在 的 应 用 情况 怎么 
样 ? 

正祥 : 开发 完毕 还 说 不 上 ， 因 为 这 个 系统 还 需要 持续 开发 。 我 们 
是 从 2010 年 5 月 开始 开发 的 ，2011 年 2 月 发 布 了 第 一 个 版 本 。 现 在 应 用 
到 了 5 至 6 个 系统 上 ， 收 藏 夹 是 最 早 的 应 用 ， 现 在 有 63 亿 条 记录 ，3TB 
的 数据 ， 访 问 量 也 比 半 年 前 增加 了 一 倍 以 上 。 以 前 用 Oracle 的 系统 是 
可 以 换 成 OceanBase 的 。 

子 柳 : 竞争 对 手 对 OceanBase 有 以 下 看 法 ， 对 此 你 怎么 看 ? 

e 有 一 个 中 心 点 ， 在 数据 量 很 大 的 情况 下 ， 单 点 有 风险 ; 

eHBase 开 源 ， 大 公司 主导 ， 很 多 坑 都 走 过 了 。 

正祥 : OceanBase 最 好 的 地 方 就 是 具备 事务 ， 数 据 一 致 性 很 好 。 
HBase 在 数据 容量 上 会 有 优势 ， 几 千 万 亿 字 节 都 有 可 能 ， 但 它 没有 解 
决 事务 的 问题 。 从 数据 规模 来 看 ， 虽 然 有 个 单 点 (有 热 备 的 ) ， 但 
OceanBase 数 据 规 模 仍 然 可 以 达到 关系 数据 库 几 十 倍 甚 至 几 百 倍 的 规 
模 。 

子 柳 : OceanBase 推 广 的 成 本 高 不 高 ? 


正祥 : OceanBase 的 推广 应 用 得 到 了 各 个 方面 的 配合 ，DBA 团 队 
已 经 跟 OceanBase 融 合 在 一 起 了 ，OPS 也 是 不 遗 余力 ， 非 常 关 键 的 是 ， 
OceanBase 得 到 了 应 用 和 业务 团队 非常 大 的 支持 。 数 据 库 的 迁移 是 有 工 
作 量 的 ， 而 且 还 是 有 风险 的 。 在 应 用 部 门 的 配合 下 ，OceanBase 已 经 做 
到 了 从 原来 的 天 系数 据 库 平 台 无 缝 迁 移 到 新 的 平台 上 ， 并 且 不 停止 服 
务 ， 在 对 OceanBase 进 行 升 级 时 也 不 停止 服务 。 到 现在 已 经 跑 了 半年 ， 
系统 也 比较 稳定 ， 且 没有 停止 过 服务 。 

子 柳 : OceanBase 应 用 之 后 ， 节 约 了 多 少 成 本 ? 

正祥 : 还 真 没 细 算 过 ， 首 先 Oracle 的 License 就 是 很 贵 的 ， 这 个 是 
我 们 能 省 下 来 的 ， 服 务 器 的 数量 也 能 减少 。 例 如 ， 收 藏 夹 ， 原 来 每 个 
机 房 有 16 台 机 器 ，OceanBase 刚 上 线 的 时 候 是 一 个 机 房 14 台 机 器 ， 后 来 
数据 量 和 访问 量 都 已 经 翻 舍 了 ， 还 是 14 台 机 器 。 现 在 我 们 正在 换 成 6 台 
SSD 盘 的 机 器 ， 预 计 能 提供 更 大 的 访问 量 。 

另外 ， 成 本 最 高 的 其 实 还 不 止 是 这 些 设备 ， 而 是 网 络 带宽 和 机 房 
机 架 等 的 成 本 。 若 减少 机 器 的 数量 ， 会 降低 这 方面 的 成 本 。 淘 宝 的 业 
务 在 高 速 增长 ， 数 据 量 和 访问 量 在 加 速 增长 ， 但 电力 和 机 房 资源 不 可 
能 同步 高 速 增长 ， 从 现在 起 ， 我 们 就 必须 在 提升 服务 能 力 和 性 能 的 同 
时 ， 降 低 服 务 器 的 使 用 量 ， 否 则 不 仅 是 成 本 令 我 们 无 法 承受 ， 机 房 和 
机 架 也 无 法 找到 。 此 外 ， 从 节省 能 源 的 角度 来 说 ， 我 们 也 必须 要 低 碳 
环保 。 

子 柳 : 在 你 的 人 生 经 历 中 ， 不 断 被 破格 提拔 ， 你 认为 原因 是 什 
么 ? 

正祥 : 我 的 运气 比较 好 ， 机 会 也 比较 好 。 我 自己 的 要 求 比较 低 ， 
除了 对 住 的 地 方 要 求 高 一 些 (我 睡觉 很 轻 ， 呵呵) ， 吃 穿 之 类 的 都 没 
哈 追 求 。 我 属于 那 种 党 叫 干 哈 就 干 哈 的 人 (里 然 不 是 党 员 ) ， 而 且 我 
的 运气 非常 好 ， 遇 到 了 一 些 很 好 的 老师 (比如 王选 老师 等 ， 站 在 巨 
人 的 肩 上 做 事 ， 把 手 上 事情 做 好 就 成 ， 就 这 样 。 

子 柳 : 从 你 的 经 历来 看 ， 你 对 现在 的 技术 人 员 的 成 长 有 什么 建 
议 ? 

正祥 : 很 多 人 会 说 年 轻 人 比较 浮躁 ， 其 实 我 的 身边 有 很 多 非常 优 
秀 的 年 轻 人 ， 他 们 聪明 、 刻 苦 、 有 问 劲 、 愿 意 接受 新 事物 。 年 轻 的 同 


事 想 赚钱 ， 想 提升 自己 的 职称 ， 这 些 都 是 十 分 正常 的 。 在 这 点 上 ， 我 
特别 喜欢 马 总 的 理念 一 一 做 公司 要 赚钱 ， 但 阿里 从 不 把 赚钱 作为 第 一 
目标 ， 我 们 服务 好 了 客户 ， 客 户 赚 了 钱 ， 我 们 一 定 会 得 到 自己 应 得 的 
一 份 。 在 个 人 成 长 问题 上 也 是 类 似 的 道理 ， 这 就 是 ， 一 个 人 如 果 把 做 
事 、 做 成 事 作 为 主要 目标 ， 该 他 得 到 的 东西 ， 一 定 会 顺理成章 的 、 水 
到 渠 成 地 得 到 ， 但 是 ， 如 果 把 上 升 作 为 主要 目标 ， 做 同样 的 事 ， 结 果 
就 会 完全 不 一 样 。 一 句 话 ， 你 的 心态 会 最 终 决 定 你 的 成 就 。 

子 柳 : 在 北大 期 间 师 从 王选 院士 ， 他 对 你 有 什么 影响 ? 

正祥 : 我 能 做 他 的 学 生 真 的 是 运气 很 好 ， 王 老师 给 我 的 影响 非常 
大 ， 他 心胸 开阔 ， 是 我 接触 到 的 最 伟大 的 人 。 我 跟 了 他 13 年 ， 从 他 身 
上 学 到 了 不 少 东 西 〈 可 惜 我 悟性 和 能 力 不 足 ， 有 太 多 的 东西 没有 学 
到 ) 。 当 时 我 们 研究 所 只 有 二 三 十 个 人 ， 他 对 我 们 的 指导 非常 多 。 他 
和 他 的 夫人 陈 莫 鳞 教授 前 期 做 了 大 量 的 研究 ， 才 有 后 来 我 们 团队 做 出 
来 的 那些 成 果 。 而 那 种 朴素 的 只 想 把 一 件 事情 做 好 的 感觉 ， 也 深 受 他 
的 影响 。 

子 柳 : 除了 王选 之 外 ， 在 技术 领域 ， 对 你 影响 最 大 的 人 是 谁 ? 

正祥 : 没有 其 他 人 了 ， 王 老师 的 高 度 太 高 了 ， 没 有 人 能 像 他 一 
样 ， 给 我 这 么 大 的 影响 。 

子 柳 : 你 经 历 了 联想 、 微 软 、 百 度 、 淘 宝 这 几 大 企业 ， 能 否 描述 
一 下 你 在 各 个 企业 中 的 主要 收获 ? 

正祥 : 跟着 王选 老师 在 北大 方正 集团 做 了 十 几 年 ， 当 时 的 方正 是 
技术 好 但 管理 不 足 的 企业 ， 而 联想 是 一 个 管理 很 好 的 企业 ， 我 很 想 看 
看 联想 是 怎么 管理 的 ， 所 以 离开 方正 和 北大 后 就 去 了 联想 做 无 线 投影 
仪 设备 ， 前 后 用 了 差不多 3 年 时 间 ， 完 成 后 ， 在 探索 新 的 项 目 和 方向 
时 ， 就 定位 为 存储 ， 无 意 中 了 解 到 了 Google 的 GFS， 但 云 计 算 和 联想 
主 业 (PC 等 ) 的 差距 较 大 ， 做 这 个 事情 的 可 能 性 较 小 。 于 是 我 去 了 微 
软 亚洲 研究 院 ， 做 了 一 段 时 间 后 ， 发 现 要 应 用 到 微软 那些 比较 核心 的 
产品 上 的 障碍 很 多 ， 包 括 地 域 的 、 语 言 上 、 文 化 的 ， 做 这 个 最 好 还 是 
去 硅谷 或 西雅图 。 一 年 多 之 后 去 了 百度 ， 在 百度 待 了 两 年 多 ， 做 的 偏 
BigTable (当时 HBase 还 不 能 用 ) ， 百 度 是 一 个 星期 重建 一 次 索引 数 
据 ， 当 时 就 想 希 望 改 进 这 一 块 ， 在 百度 那 边 的 项 目 做 完了 ， 但 最 后 没 
有 应 用 ， 并 且 项 目 也 被 关闭 了 。 


子 柳 : 以 上 几 个 企业 的 技术 风格 有 什么 不 同 ? 

正祥 : 就 我 在 职 期 间 的 感受 一 一 联想 要 求 研发 人 员 要 了 解 市 场 ， 
跟着 一 个 产品 从 市 场 需求 到 开发 ， 再 到 小 批量 生产 、 真 正 量 产 等 整个 
环节 。 微 软 的 研发 模式 比较 重 ， 流 程 和 审核 机 制 非 常 严格 ， 每 一 行 代 
码 都 要 审核 很 多 遍 ， 做 事 很 稳 ， 但 很 慢 ， 我 想 这 也 是 它 在 互联 网 市 场 
很 难 施展 的 一 个 原因 。 我 觉得 百度 其 实 不 如 淘宝 重视 技术 ，KPI 导 向 
的 文化 很 重 ， 各 部 门 之 间 的 协作 和 配合 比较 难 (这 一 点 淘宝 要 好 不 
少 ) ， 不 同 部 门 、 不 同 项 目的 开发 人 员 做 了 不 少 有 差别 但 其 实 比较 类 
似 的 东西 ， 看 起 来 个 体 效率 高 ， 但 整体 效率 未 必 高 ， 这 可 能 是 百度 加 
班 很 严重 的 原因 之 一 。 

子 柳 : 你 很 早 就 是 一 个 研究 室 的 主任 ， 能 够 带 队 开发 。 但 你 在 淘 
宝 是 没有 下 属 的 ， 为 什么 ? 

正祥 : 我 在 微软 和 百度 也 没有 下 属 ， 我 最 大 的 长 处 是 做 技术 ， 管 
理 方面 比 我 擅长 的 人 有 很 多 ， 那 就 让 他 们 管 吧 ， 呵 呵 。 管 理 对 我 来 说 
实在 是 一 项 艺术 ， 我 还 是 更 偏 技 术 。 

子 柳 : 你 在 没有 直接 下 属 的 情况 下 ， 靠 什么 方法 带领 开发 团队 ? 

正祥 : 其 实事 情 是 大 家 一 起 做 的 ， 这 不 是 我 个 人 的 产品 ， 是 整个 
团队 的 ， 这 个 团队 非常 优秀 ， 多 隆 在 这 个 团队 做 了 不 少 关 键 的 工作 ， 
东 邪 、 正 明和 楚 材 等 领导 以 及 整个 团队 都 非常 支持 我 。 

子 柳 : 你 还 在 写 代码 吗 ? 你 怎么 控制 系统 的 实现 符合 你 的 预期 ? 

正祥 : 我 非常 喜欢 写 代 码 ， 前 段 时 间 还 在 写 一 个 数据 压缩 的 算 
法 ， 但 效果 不 理想 ， 没 有 放 上 去 。 现 在 写 代 码 的 时 间 很 少 了 ， 但 他 们 
写 的 代码 我 都 要 看 ， 这 两 个 月 在 外 面 招聘 新 人 人， 有些 新 的 代码 还 没 来 
得 及 看 。 

子 柳 : 你 还 想 在 哪些 领域 有 突破 ? 你 的 研究 方法 是 什么 样 的 ? 

正祥 : 我 还 没有 那么 长 远 的 眼光 ,但 从 Google 来 看 ， 他 们 做 
GFS、MapReduce、BigTable 的 人 都 还 一 直 在 做 ， 我 觉得 淘宝 在 数据 存 
储 和 处 理 领域 应 该 还 有 很 长 的 路 要 走 。 例 如 ， 我 们 的 事务 目前 是 单机 
做 的 ， 但 后 面 也 可 以 做 到 一 个 集群 ， 另 外 ， 我 们 也 考虑 把 SQL 语言 的 
支持 逐渐 加 进去 。 我 们 现在 只 是 在 传统 数据 库 上 迈 了 一 个 小 台阶 ， 后 
面 还 有 很 大 的 空间 。 


子 柳 : 你 怎么 平衡 工作 和 生活 ? 
正祥 : 我 对 生活 上 的 需求 比较 低 ， 没 什么 特别 的 爱好 ， 这 个 
就 是 在 家 的 时 间 比 较 少 一 点 。 
子 柳 : 能 否 八 卦 一 下 你 的 家 庭 状况 ? 
正祥 : 三 口 之 家 , 日 常生 活 中 都 是 太太 做 主 。 
子 柳 : 你 在 着 装 方面 很 朴素 ， 这 种 风格 很 多 人 都 津津 乐 道 ， 能 否 
八卦 一 下 原因 ? 

正祥 : 其 实 我 的 出 身 比较 贫寒 ， 小 时 候 真 的 是 饿 过 肚子 的 。 我 小 
时 候 的 玩 伴 ， 现 在 还 有 人 在 为 生计 发 秋 。 i 我 认 
为 社会 给 我 的 已 经 高 于 我 给 社会 的 。 我 的 品位 上 不 去 ， 这 不 是 刻意 为 
之 ， 大 家 不 用 学 习 这 一 点 。 

编 后 语 : 这 位 大 侠 系 出 名 门 (北大 王选 的 门徒 ) ， 也 出 身 寒 微 
(贫寒 人 家 ) ， 他 在 生活 上 非常 “ 没 品 位 *”， 却 在 技术 上 追求 最 顶尖 的 
水 准 。 这 些 矛盾 的 属性 在 他 身上 却 是 协调 的 统一 。 这 种 自身 的 谦 鼻 造 
就 了 他 在 事业 上 坚定 的 专注 ， 对 正祥 的 这 些 品味 ， 也 许 值 得 从 事 技 术 
的 朋友 好 好 品味 一 下 。 


毕 芯 一 一 集团 核心 系统 资深 技术 专家 


好 


-> 


毕 辫 从 2006 年 加 入 淘宝 开始 ， 在 商业 产品 中 使 用 OSGi， 先 后 编写 
了 《OSGi 实 践 》《OSGi 进 阶 》 两 篇 Oopendoc， 以 及 《OSGi 原 理 与 最 佳 
实践 》 一 书 ， 为 OSGi 在 中 国 的 推广 起 到 了 绵薄 之 力 。 目 前 负责 淘宝 网 
的 高 性 能 服务 框架 ， 此 服务 框架 每 天 的 服务 请 求 量 已 超过 100 亿 次 ， 
2010 年 6 月 出 版 了 《分 布 式 Java 应 用 : 基础 与 实践 》 一 书 。 

个 人 感 兴趣 的 技术 方向 为 : 高 可 用 、 高 并 发 、 高 性 能 、 可 伸缩 、 
低 成 本 的 互联 网 技术 ， 以 及 动态 化 、 模 块 化 的 大 型 分 布 式 Java 应 用 的 
技术 。 

子 柳 (主持 人 ) : 你 做 的 HBase 和 集群 的 应 用 现在 是 什么 规模 ? 

毕 辫 : 现在 大 概 有 15 个 HBase 独 立 集群 ， 上 面 大 概 有 20 个 项 目 在 
运行 。 现 在 还 没有 很 大 数量 级 的 ， 都 是 几 十 亿 条 数据 ， 还 没有 百 亿 或 


千 亿 条 的 。 后 面 我 们 很 快 会 上 一 个 项 目 ， 那 个 项 目 应 该 是 千 亿 条 数据 
以 上 的 。 

子 柳 : 淘宝 的 HBase 有 什么 特色 ? 

毕 玄 : 最 重要 的 是 稳定 性 方面 的 改进 ， 其 他 的 可 能 与 外 界 都 差 不 
多 。 人 在 部 署 上 ， 我 们 的 HBase 会 加 上 一 套 监控 系统 和 一 套 与 运 维 相关 
的 东西 ( 若 没 有 这 个 是 很 危险 的 ) 。 还 有 一 个 ， 我 们 的 HBase 比 官方 
的 成 熟 一 点 可 能 是 我 们 的 应 用 比较 多 ， 不 是 一 种 用 法 ， 而 是 有 很 多 种 
用 法 ， 我 们 面临 的 问题 比 别人 会 稍微 多 一 点 。 

(主持 人 : 这 样 会 不 会 把 HBase 搞 复杂 呢 ? ) 不 会 的 ， 我 们 跟 
Facebook 一 样 强 调 只 把 HBase 当 作 一 个 存储 。 

子 柳 : 像 你 这 个 层级 的 技术 专家 ， 除 了 做 好 自己 的 东西 外 ， 还 需 
要 推广 自己 的 技术 和 理念 ， 在 推广 的 过 程 中 有 没有 障碍 ? 

毕 玄 : 其 实 从 现在 来 看 ， 推 广 的 几 个 东西 都 还 好 。 障 碍 方面 ， 通 
常 是 看 你 要 推广 的 这 个 东西 跟 其 他 的 冲突 有 多 大 。 可 能 当时 正好 有 别 
人 也 要 做 类 似 的 东西 ， 这 个 时 候 也 许 能 会 有 一 些 障碍 。 对 我 来 讲 ， 我 
不 管 别 人 有 没有 用 我 的 东西 ， 只 要 我 的 想法 落地 就 行 了 ， 这 个 想法 到 
底 被 怎么 实现 ， 谁 去 实现 ， 其 实 没有 那么 重要 。 

子 柳 : 做 这 种 底层 的 通用 的 产品 ， 需 要 跟 很 多 人 合作 ， 你 最 喜欢 
和 什么 类 型 的 人 合作 ? 

毕 玄 : 只 要 能 干 活 的 人 就 好 了 ， 大 家 都 认同 这 个 想法 会 给 公司 
业务 带 来 什么 好 处 ， 然 后 就 去 做 ， 不 要 想 太 多 。 

(主持 人 : 这 样 说 来 ， 是 不 是 有 些 不 太 干 活 的 人 呢 ? ) 是 有 一 些 
人 会 比较 看 重 目 己 的 职责 ， 如 果 不 是 自己 的 职责 ， 可 能 就 不 管 。 

子 柳 : 你 在 微 博 上 写 道 “在 公司 四 年 以 来 ， 最 让 自己 自豪 、 最 有 成 
就 感 和 最 骄傲 的 是 三 件 事 (一 个 产品 ， 两 个 思想 的 推行 和 落地 成 产 
品 ) ， 现 在 正在 做 第 四 件 ， 计 划 第 五 件 ” 能 不 能 解释 下 ， 这 五 件 都 
是 什么 事 ? 

毕 玄 : 第 五 件 不 能 说 ， 其 他 四 件 可 以 说 。 第 一 个 产品 是 淘宝 的 自 
动 发 布 系统 ， 其 实 这 个 系统 的 技术 含量 很 低 ， 现 在 淘宝 所 有 的 Java 系 
统 都 是 通过 这 个 发 布 的 ， 全 部 是 自动 发 的 。 对 我 来 说 ， 虽 然 这 个 产品 


过 


没有 什么 技术 含量 ,但 它 给 淘宝 带 来 了 改变 。 这 件 事 也 是 我 自己 发 起 
的 ， 所 以 很 有 成 就 感 。 

关于 另外 两 个 思想 ， 第 一 个 是 容量 规划 ， 这 个 事情 以 前 淘宝 是 没 
有 做 过 的 ， 虽 然 最 后 这 个 事情 也 不 是 我 做 的 ， 但 后 来 在 CSP 中 也 成 了 
一 个 产品 ， 我 觉得 容量 规划 对 一 个 公司 来 讲 ， 是 一 个 非常 重要 的 阶 
段 。 还 有 一 个 思想 是 优雅 降级 ， 优 雅 降级 这 个 事情 说 了 很 久 ， 一 开始 
是 很 难 被 人 接受 的 ， 到 现在 几乎 所 有 的 系统 都 采用 了 ， 这 个 目前 最 明 
显 地 体现 在 淘宝 保护 “大 促 ” 的 一 种 情况 。 

现在 我 们 正在 做 的 第 四 件 事情 ， 就 是 把 淘宝 的 整个 运 维 体系 做 一 
定 的 修改 ， 现 在 淘宝 的 扩容 很 不 方便 ， 会 受 限 于 网 络 因素 等 。 以 后 我 
们 会 希望 能 有 一 套 系 统 ， 使 整个 淘宝 的 扩容 非常 简单 ， 你 只 要 想 扩 
容 ， 就 可 以 扩容 ， 然 后 我 们 会 尽 可 能 地 提高 机 器 的 利用 率 ， 这 个 是 现 
在 正在 做 的 第 四 件 事 。 

\ 主 持 人 : 我 本 以 为 你 是 要 说 一 下 Java 中 间 件 的 方面 ) 这 可 能 是 
我 在 公司 影响 到 人 最 多 的 一 个 产品 ， 但 我 认为 是 因为 刚好 我 在 这 个 位 
置 上 ， 如 果 换 成 别人 ， 结 果 应 该 是 差不多 的 。 

子 柳 : 你 目 己 经 历 了 几 次 技术 转型 ， 为 什么 转型 ? 转型 最 大 的 困 
难 在 什么 地 方 ? 

毕 立 : 我 觉得 我 的 转型 是 跟 淘宝 绑 在 一 起 的 。 我 刚 到 淘宝 面临 的 
是 淘宝 访问 量 带 来 的 压力 ， 我 们 需要 解决 访问 量 的 问题 ， 于 是 我 们 就 
做 了 很 多 Java 的 中 间 件 ， 其 实 当 时 我 也 不 是 很 熟 ， 呵 呵 。 

当 解 决 了 一 个 访问 量 的 问题 之 后 ， 数 据 量 就 开始 大 增 ， 于 是 就 面 
临 一 个 数据 量 的 问题 ， 我 们 就 开始 想 怎 么 支撑 这 么 大 数据 量 的 存储 、 
分 析 、 挖 掘 等 工作 ， 所 以 后 来 我 就 转型 到 做 数据 方面 的 工作 。 

转型 最 困难 的 地 方 在 于 ， 很 多 人 以 为 我 的 层级 很 高 ， 对 我 抱 有 很 
大 的 期 望 。 但 是 过 去 的 所 有 这 些 积累 ， 对 我 的 帮助 并 不 是 很 大 。 当 我 
进入 一 个 全 新 的 领域 后 ， 很 多 东西 都 要 从 头 开 始 。 但 是 由 于 大 家 认为 
我 的 层级 很 高 ， 所 以 就 期 望 我 在 很 短 的 时 间 内 能 做 出 很 好 的 效果 ， 这 
会 给 自己 带 来 很 大 压力 。 如 果 我 转型 做 的 这 个 产品 刚好 是 这 个 时 代 所 
需要 的 ， 有 业务 场景 ， 这 样 会 好 很 多 。 


子 柳 : 我 了 解 到 你 是 学 生物 学 的 ， 现 在 却 是 互联 网 技术 专家 ， 请 
描述 一 下 这 一 路 是 怎么 走 过 来 的 ? 

毕 玄 : 我 本 科 是 学 生物 的 ， 毕 业 之 后 是 做 政府 企业 系统 软件 的 ， 
这 个 跟 互 联网 行业 完全 属于 不 同 的 领域 。 我 在 企业 领域 做 过 多 年 ， 后 
来 有 一 些 机 会 接触 到 互联 网 行业 ， 比 如 腾讯 的 技术 。 这 些 互联 网 的 技 
术 对 我 们 企业 做 开发 的 人 的 震撼 是 非常 大 的 ， 而 且 成 就 感 也 不 一 样 。 
以 前 我 也 会 觉得 互联 网 应 用 没有 什么 技术 含量 ， 就 觉得 那 只 是 一 个 网 
站 而 已 ， 搞 技术 的 人 都 能 随手 做 出 来 一 个 。 但 我 了 解 到 腾讯 的 技术 以 
后 ， 就 觉得 加 入 一 家 互联 网 企业 也 挺 好 的 ， 想 去 看 一 下 一 家 互联 网 网 
站 是 怎么 做 出 来 的 。 后 来 我 就 加 入 一 家 叫做 “五 自 万 ”的 做 彩票 的 网 
站 。 加 入 之 后 ， 我 才 发 现 一 个 好 的 网 站 真 的 是 很 难 很 难 做 ， 其 中 的 技 
术 含 量 非常 高 ， 有 很 多 东西 需要 学 习 。 从 “五 百 万 ”网 站 出 来 以 后 ,我 
就 加 入 了 淘宝 。 

子 柳 : 你 每 天 有 多 少时 间 用 于 编码 ? 多 少时 间 学 习 ? 

毕 辫 : 现在 如 果 没 有 什么 特殊 情况 的 话 ， 我 会 花 很 多 时 间 看 技术 
方面 的 文章 或 者 图 书 ， 写 代码 的 时 间 可 能 每 天 只 有 两 三 个 小 时 。 每 隔 
一 段 时 间 会 去 想 一 想 将 来 干什么 比较 好 ， 因 为 写 代 码 时 间 会 过 得 很 
快 ， 要 经 单 跳出 来 想 一 想 。 

(主持 人 :; 有 哪些 比较 占用 时 间 但 价值 不 大 的 事情 呢 ? ) 比方 
说 ， 开 各 种 各 样 的 会 啊 .…… 

子 柳 : 你 来 淘宝 技术 大 学 授课 的 时 候 ， 给 学 员 说 过 “但 行 好 事 ， 不 
问 前 程 ”， 现 在 很 多 同学 都 因为 晋升 的 问题 很 纠结 ， 可 否 解释 一 下 自己 
是 怎么 看 竺 晋升 的 ? 

毕 鼠 : 大 家 都 说 了 ， 晋 升 是 一 个 “水 到 渠 成 ”的 事情 。 大 家 都 会 在 
意 晋 升 ， 这 个 是 正 党 的， 除非 你 不 在 意 级 别 ， 生 活 上 也 没有 压力 ， 不 
过 这 样 的 人 是 很 少 的 ， 呵 呵 。 如 果真 的 没有 升 上 去 ， 这 个 也 没有 什么 
办 法 能 够 挽救 了 。 我 觉得 重要 的 是 在 这 个 过 程 中 你 回顾 了 你 一 年 做 了 
什么 事情 ， 对 公司 有 什么 贡献 ， 技 术 上 有 哪些 成 长 。 

对 于 技术 人 员 最 常见 的 一 种 情况 是 晋升 名 单 公布 的 时 候 ， 你 去 看 
谁 升 上 去 了 ， 然 后 对 比 一 下 自己 ， 觉 得 他 水 平 不 如 自己 ， 为 什么 是 他 
得 到 了 晋升 ， 而 不 是 你 。 我 觉得 最 重要 的 是 看 那个 人 对 公司 做 了 多 人 少 


贡献 ， 你 可 以 说 你 的 技术 确实 很 强 ， 但 事实 是 你 对 公司 没有 做 出 任何 
贡献 。 

子 柳 : 你 是 技术 晋升 的 评委 ， 在 评审 的 过 程 中 ， 你 比较 看 重 什么 
样 的 特质 ? 

毕 玄 : 如 果 你 是 向 技术 方向 发 展 的 人 员 ， 我 们 要 看 技术 方面 的 专 
业 性 ， 然 后 看 你 的 拷 术 对 公司 的 业务 发 展 有 多 少 贡 献 。 还 有 一 点 ， 我 
比较 看 重 的 是 ， 也 许 你 不 在 其 位 ， 但 能 够 跳出 自己 的 范围 ， 想 到 公司 
未 来 到 底 会 面临 什么 问题 ， 用 什么 方法 来 解决 。 当 然 ， 仅 想 是 不 够 
的 ， 如 果 你 能 够 落实 就 最 好 了 ， 我 们 不 管 你 落实 的 技术 含量 有 多 高 ， 
关键 是 你 解决 了 什么 样 的 问题 。 如 果 你 能 够 做 到 这 些 ， 你 这 个 人 对 公 
司 束 非常 重要 。 

子 柳 : 你 经 常 出 去 招聘 学 生 ， 你 欣赏 什么 样 的 学 生 ? 

毕 冬 : 其 实在 校 招聘 的 时 候 ， 我 比较 欣赏 的 学 生 往往 是 那些 很 “不 
务 正业 ”类 型 的 。 我 经 常会 问 他 们 ， 你 有 没有 利用 业余 时 间 出 于 自己 的 
技术 兴趣 做 的 一 些小 东西 。 这 样 的 学 生 我 们 通常 会 比较 感 兴趣 ， 我 认 
为 这 样 的 学 生 是 真正 喜欢 技术 。 聪 明 程度 一 般 就 可 以 的 ， 他 能 够 进入 
这 些 不 错 的 学 校 ， 智 商 是 不 会 有 什么 问题 的 。 

子 柳 : 而 立 之 年 ， 有 房 有 和 车， 马上 又 有 小 孩 了 ， 可 以 说 “老婆 孩子 
热 炳 头 ?都 达到 了 ， 接 下 来 你 还 想 追 求 的 是 什么 呢 ? 你 的 人 生理 想 又 是 
什么 ? 

毕 立 : 以 前 想 的 是 用 技术 来 改变 世界 ， 现 在 看 来 不 得 不 接受 这 是 
很 难 做 到 的 。 所 以 ， 现 在 想 的 融 是 目 己 所 做 的 技术 能 够 给 公司 市 来 改 
变 ， 使 公司 从 一 个 阶段 上 升 到 另 一 个 阶段 ， 这 就 是 我 目前 的 理想 。 


放 丛 一 一 淘宝 开放 平台 项 目 负责 人 


放 翁 于 2006 年 3 月 加 入 阿里 巴巴 ，2007 年 初 加 入 阿里 软件 创业 团 
队 ， 负 责 基 础 平台 架构 设计 与 实现 ，2007 年 年 底 与 淘宝 合作 开始 研发 
开放 平台 ， 负 责 开 放 平 台 体 系 架 构 设 计 与 实现 ，2009 年 8 月 加 入 淘宝 ， 
负责 淘宝 开放 平台 架构 。 


主编 寄语 : 有 这 么 一 类 工程 师 ， 他 们 在 技术 上 有 了 深厚 的 积淀， 
他 们 初 为 人 夫 ， 也 初 为 人 父 。 他 们 既是 公司 里 的 顶 梁 柱 ， 也 是 家 里 的 
顶 梁 柱 。 他 们 这 一 路 是 如 何 成 长 的 ? 他 们 当前 在 承担 什么 样 的 责 任 ? 
他 们 有 哪些 痛苦 与 快乐 ? 他 们 如 何 展 望 未 来 ? 我 们 找到 了 这 样 一 位 典 
型 的 代表 人 物 一 一 放 翁 ， 且 听 他 九 娓 道 来 。 

作为 技术 专家 

子 柳 : 作为 一 名 技术 专家 ， 你 的 成 长 之 路 是 什么 样 的 ? 

放 丛 : 我 从 毕业 到 现在 ， 就 在 两 家 公司 干 过 。 第 一 家 就 是 东方 通 
信 股 份 有 限 公 司 (简称 东信 ) ， 然 后 就 是 阿里 巴巴 。 东 信和 是 国企 ,我 
在 那里 做 了 4 年 ， 从 一 个 学 生 很 快 做 到 一 个 小 部 门 的 主管 ， 这 个 成 长 的 
主要 原因 是 我 的 直属 领导 不 断 离职 ， 我 就 不 断 地 补 上 去 了 。 从 技术 上 
说 ， 在 这 里 有 成 长 ， 但 不 是 很 大 。4 年 以 后 ， 我 感觉 自己 的 发 展 遇 到 了 


瓶颈 ， 虽 然 在 这 里 生活 比较 安逸 ， 但 不 是 这 个 年 龄 应 该 有 的 状态 ， 当 
时 也 才 27 岁 左右 ， 就 想 换个 环境 。 

然后 我 应 聘 了 阿里 巴巴 的 两 个 岗位 ， 第 一 个 是 一 个 后 台 的 部 门 ， 
发 现 不 是 我 想 做 的 。 后 来 有 一 个 阿里 软件 的 概念 ， 提 出 了 work at 
Alibaba 的 想法 ， 当 时 自己 对 这 个 想法 挺 感 兴趣 ， 就 加 入 了 阿里 巴巴 。 
加 入 之 后 发 现 并 没 用 想象 中 的 那么 好 ， 因 为 一 下 子 从 一 个 工作 灵活 度 
比较 大 的 人 变 成 了 一 个 从 事 最 基础 的 编码 工作 的 人 员 ， 有 点 失落 。 到 
了 2006 年 年 底 ， 我 被 封闭 到 湖畔 花园 去 做 阿里 软件 的 创业 。 当 时 收购 
了 成 都 的 一 家 公司 ， 这 个 公司 专门 做 建 模 类 型 的 应 用 开发 ， 这 种 方式 
的 开发 比 作 通常 的 web 应 用 开发 能 发 挥 的 空间 还 要 小 。 大 部 分 情况 下 
是 用 XML 文件 配置 的 方式 来 搭建 一 些 管理 软件 的 应 用 。 底 层 已 经 封装 
起 来 了 ， 这 个 工作 比 现在 大 家 做 的 开发 还 要 单调 。 这 个 时 候 出 现 一 个 
问题 是 收购 过 来 的 公司 只 有 3 个 人 做 核心 平台 的 开发 ， 然 后 是 一 大 帮 人 
做 业务 的 开发 。 但 这 个 框架 本 身 还 不 成 熟 ， 有 很 多 bug， 业 务 开发 人 员 
就 会 提 很 多 bug 给 核心 团队 的 这 3 个 人 ， 他 们 当然 是 忙 不 过 来 的 ， 于 是 
大 部 分 人 就 是 等 着 他 们 去 解决 。 我 出 于 对 这 个 框架 的 兴趣 ， 就 开始 研 
究 前 端 、 后 端 和 整个 系统 ， 然 后 我 帮 他 们 去 修复 一 些 bug。 我 没有 提交 
主干 的 权限 ， 每 次 修改 完 就 告诉 他 们 ， 他 们 审核 没有 问题 之 后 ， 就 提 
交 上 去 。 就 这 么 两 周 以 后 ， 负 责 这 个 平台 的 老板 就 邀请 我 加 入 他 们 团 
队 ， 于 是 我 就 调 到 了 平台 部 。 有 这 方面 的 能 力 ， 再 加 上 机 会 ， 之 后 那 3 
个 人 还 是 在 支撑 业务 ， 而 我 负责 整个 平台 的 基础 体系 和 架构 的 运营 。 
从 湖畔 出 来 之 后 ， 整 个 阿里 软件 的 4 年 左右 的 时 间 ， 我 会 负责 整个 平台 
的 发 展 、 底 层 架 构 。 所 以 ， 在 这 方面 我 会 走 得 比较 靠 前 。 

后 来 跟 淘宝 开放 平台 合作 ， 直 接 转 入 了 开放 平台 这 里 ， 很 多 事情 
都 是 业界 第 一 次 做 ， 做 到 现在 快 4 年 了 ， 不 断 地 把 技术 做 深 。 

总 结 下 来 ， 我 的 成 长 就 是 从 一 个 国企 到 一 个 公司 ， 有 一 个 落差 。 
在 创业 团队 找到 机 会 ， 从 创业 团队 中 做 到 一 个 公司 的 架构 师 ， 然 后 再 
坚持 把 一 个 产品 不 断 做 精 做 深 ， 最 后 才 有 一 定 的 技术 发 展 和 影响 力 。 

子 柳 : 你 在 这 个 行业 里 差不多 有 10 年 了 ， 在 工作 上 有 没有 什么 痛 
苦 的 地 方 ? 

放 翁 ; 会 有 些 失落 的 地 方 ， 例 如 ， 从 东信 到 阿里 巴巴 的 时 候 ， 一 
下 子 很 难 适应 ， 做 阿里 软件 一 开始 也 是 做 很 多 琐碎 的 事情 。 我 也 跟 很 


多 新 人 说 过 ， 其 实 来 公司 三 个 月 到 半年 的 时 候 ， 是 最 难熬 的 时 间 。 接 
下 来 在 阿里 软件 也 痛苦 过 ， 虽 然 别 人 觉得 这 家 伙 很 清闲 ， 在 做 自己 喜 
欢 的 事情 ， 但 是 跟 淘宝 的 现状 一 样 ， 很 多 跟 业 务 离 得 相对 比较 远 的 一 
些 中 间 件 团队 做 出 来 的 产品 ， 应 用 到 业务 系统 上 会 有 很 大 的 阻力 。 在 
阻力 面前 ， 很 多 时 候 会 屈服 于 业务 ， 有 些 业务 会 要 求 开 一 些 白 名 单 、 
黑 名 单 、 特 殊 通道 之 类 的 东西 ， 而 作为 基础 服务 ， 我 又 要 保持 它 的 完 
整 性 和 统一 性 。 这 时 就 需要 一 些 协 调和 沟通 的 技能 。 作 为 一 个 架构 
师 ， 经 常会 有 一 种 失落 感 ， 有 时候 会 发 现 我 们 做 出 来 的 东西 有 可 能 没 
有 办 法 实施 。 我 坚持 做 开放 平台 做 了 4 年 ， 后 来 我 有 一 些 感悟 ， 我 跟 毕 
玄 都 发 觉 真 的 需要 找到 一 个 业务 点 ， 把 技术 做 深 ， 去 解决 一 个 个 的 问 
题 ， 然 后 这 个 平台 的 效果 才能 体现 出 来 。 现 在 有 了 一 个 转变 ， 从 单纯 
地 做 中 间 件 、 平 台 架 构 ， 到 成 为 业务 团队 的 一 个 业务 架构 师 。 现 在 技 
术 架 构 师 和 业务 架构 师 两 方面 都 在 做 。 

开放 平台 是 一 个 中 间 的 东西 ， 很 多 地 方 是 需要 依赖 于 后 端 ， 我 需 
要 后 端 支持 的 东西 有 时 候 他 们 并 不 关心 ， 这 时 候 就 要 坐 下 来 与 人 谈 。 
在 公司 里 做 事 ， 很 多 人 是 自己 做 还 好 ， 但 要 跟 别人 一 起 做 ， 跟 各 个 半 
门 协作 的 时 候 ， 就 遇 到 麻烦 了 。 对 于 技术 人 员 来 说 ， 这 也 是 需要 成 长 
的 。 

另外 ， 跟 其 他 公司 做 开放 平台 一 样 碰 到 的 问题 ， 就 是 每 个 部 门 都 
希望 去 做 开放 ， 这 个 时 候 开 放 和 平台 响应 够 不 够 快 ， 服 务 够 不 够 好 ， 会 
使 得 别人 愿 不 愿意 通过 你 的 开放 平台 来 做 。 我 们 发 现 百 度 、 腾 讯 、 盛 
大 也 都 这 样 ， 开 放 平 台 希 望 自己 是 全 公司 统一 的 开放 平台 ， 但 事实 上 
是 每 个 部 门 都 在 做 开放 平台 。 现 在 我 们 的 思想 也 放 开 了 ， 与 其 是 通过 
行政 的 手段 去 堵 ， 去 要 求 别人 ， 还 不 如 自己 把 产品 做 好 ， 这 样 这 些 部 
门 自然 而 然 会 去 想 他 要 不 要 花 这 么 大 代价 去 做 这 个 事情 。 我 在 想 ， 做 
技术 产品 需要 转变 一 个 思路 ， 靠 行政 和 强制 措施 要 求 别人 用 你 的 东 
西 ， 短 期 有 效 ， 但 长 期 来 看 ， 还 是 要 看 技术 过 不 过 硬 ， 有 没有 站 在 用 
户 的 角度 考虑 问题 ， 产 品 做 得 够 不 够 好 。 

子 柳 : 级 别 到 达 P 级 中 最 高 的 以 后 ， 你 在 技术 上 的 目标 没有 人 能 
帮 你 把 握 了 ， 那 你 现在 关注 的 重点 是 什么 ? 你 后 面 还 要 怎么 成 长 ? 

放 丛 : 其 实 从 P7 级 开始 ， 就 没有 人 帮 有 我 做 规划 了 。 技 术 委员 会 在 
级 别 P7~P9 的 定义 中 ， 要 求 P7 级 的 人 员 要 对 一 个 小 的 产品 或 团队 有 方 


向 性 的 指导 ，P8 级 就 要 求 在 一 个 大 部 门 或 公司 级 的 产品 上 有 方向 性 的 
中 导 ，P9 级 要 求 除了 考虑 自身 的 产品 之 外 ， 还 要 站 在 公司 的 角度 考虑 
自身 的 产品 对 公司 的 发 展 有 什么 帮助 。 对 我 来 说 ， 在 开放 平台 不 能 只 
考虑 开放 平台 本 身 发 展 得 好 不 好 ， 要 看 它 对 其 他 部 门 或 整个 公司 的 发 
展 有 什么 帮助 。 我 坚定 地 做 开放 平台 ， 是 相信 那么 多 公司 做 开放 ， 未 
来 的 合作 多 于 竞争 ， 例 如 ， 我 们 与 新 浪 合 作 ， 他 们 能 得 到 更 多 的 微 博 
用 户 ， 我 们 能 得 到 更 多 的 交易 量 。 我 想 把 开放 平台 做 得 更 深入 ， 能 够 
跟 各 大 互联 网 公司 打通 ， 借 助 外 部 的 各 种 资源 ， 给 我 们 的 买 家 和 卖家 
创造 更 多 的 机 会 。 

从 技术 上 看 ， 我 都 是 贴近 实际 的 问题 来 找 突破 点 ， 解 决 了 问题 ， 
技术 就 掌握 了 。 说 实在 的 ， 现 在 也 会 遇 到 一 些 瓶 须 ， 到 一 定 阶段 ， 我 
的 技术 已 经 足够 快 了 ， 但 是 业务 上 还 没有 跟 上 ， 这 时 很 多 技术 人 员 会 
觉得 困惑 。 我 自己 会 去 多 想 一 些 东西 ， 包 括 我 们 现在 去 做 TQL、 长 连 
接 数据 推送 等 ， 我 们 在 技术 上 有 很 大 创新 ， 在 业界 也 有 很 大 的 影响 
力 。 但 站 在 客户 的 角度 来 看 ， 我 们 需要 用 一 些 方式 去 推广 。 明 年 
(2013 年 ) 我 会 花 一 些 精 力 去 学 校 、ISV 等 地 把 我 们 好 的 东西 推送 出 
去 。 

子 柳 : 现在 开放 平台 做 出 了 什么 样 的 成 绩 ? 

放 翁 : 从 光棍 节 的 大 促销 看 ， 那 些 商 城 卖 家 和 集 市 上 的 大 卖家 有 
95% 都 接 入 了 开放 平台 ， 从 实际 效果 来 看 ， 接 入 开放 平台 和 不 接 入 的 
有 90% 的 差别 。 也 就 是 说 ， 他 们 处 理 订单 的 速度 、 发 货 的 速度 和 退货 
的 速度 有 非常 大 的 差别 。 我 们 对 大 卖家 的 ERP 系 统 已 经 了 有 很 好 的 贡 
献 ， 另 外 ， 我 们 对 类 目的 导购 、 装 修 市 场 、 手 机 淘宝 ， 以 及 与 新 浪 、 
美丽 说 等 系统 的 结合 做 得 越 来 越 多 了 ， 整 个 体系 在 慢 慢 地 打开 。 

子 柳 : 腾讯 、 新 浪 都 在 做 开放 平台 ， 我 们 和 他 们 是 一 个 什么 样 的 
关系 ? 

放 伍 : 对 于 互联 网 上 普通 的 产品 ， 大 家 做 得 越 多 ， 其 竞争 越 历 
害 。 而 开放 平台 不 是 ， 大 家 做 得 越 多 ， 其 体系 越 完善 。 比 如 ， 我 们 与 
新 浪 合 作 ， 大 家 各 有 所 需 ， 他 们 需要 用 户 信 息 、 活 路 度 ， 我 们 要 的 是 
交易 。 就 像 Facebook 一 样 ， 它 不 是 什么 都 要 ， 他 要 的 是 用 户 ， 用 户 在 
这 里 玩 任 何 东 西 产 生 的 结果 ， 像 买 东西 、 玩 游戏 ， 他 们 不 关心 ， 用 户 
在 他 这 里 玩 ， 这 个 平台 就 是 成 功 的 。 


子 柳 : 你 已 经 升级 为 淘宝 技术 大 学 太 师 级 讲师 克 注 1， 你 这 种 传道 
的 动力 来 目 哪里 ? 

放 丛 : 最 大 的 动力 是 我 希望 开放 平台 是 支持 淘宝 未 来 3 一 5 年 发 展 
的 一 个 平台 ， 这 样 一 个 平台 单 靠 一 个 部 门 做 不 了 ， 我 希望 借助 技术 大 
学 这 样 一 个 入 口 ， 把 我 这 些 思想 传播 给 更 多 的 人 。 当 他 做 事 的 时 候 ， 
会 知道 有 开放 平台 这 样 一 个 方向 。 

子 柳 : 你 给 工程 师 的 分 享有 反响 非常 好 ， 你 认为 什么 样 的 分 享 能 打 
动工 程 师 的 内 心 ? 

放 翁 : 有 两 点 ， 技 术 人 员 首 先 会 关心 技术 好 不 好 ， 若 技术 不 好 ， 
讲 得 再 好 都 会 感觉 有 些 浮 ， 所 以 每 次 我 都 会 讲 些 技 术 方 面 的 内 容 ， 不 
是 具体 的 实现 细节 的 技术 ， 而 是 通用 的 一 些 思想 和 方法 。 另 外 一 点 就 
是 我 对 开放 平台 的 一 种 信仰 和 思想 ， 我 能 通过 开放 平台 为 淘宝 做 什 
么 。 这 样 其 他 人 会 感受 到 听 这 个 课 是 有 帮助 的 。 

子 柳 : 你 对 新 人 的 要 求 是 什么 样 的 ? 

放 翁 : 第 一 个 是 做 事 要 目 己 思考 后 再 去 问 别 人 ， 而 不 是 一 遇 到 问 
题 就 找 人 求助 。 第 二 个 是 不 断 地 打破 自己 的 一 些 想法 ， 你 不 要 担心 自 

今天 已 经 做 了 50% 的 工作 ， 要 是 推倒 重 来 ， 前 面 的 事情 都 白 干 了 。 
我 现在 之 的 两 个 新 人 成 长 很 快 ， 但 是 都 有 类 似 的 经 历 ， 就 是 一 个 东西 
被 我 反复 推翻 重 做 ， 在 这 个 过 程 中 就 是 不 断 地 成 长 ， 要 思考 我 为 什么 
让 你 推倒 重 做 ， 若 想 不 清楚 ， 下 次 重 做 的 概率 会 更 大 ， 这 样 慢 慢 地 就 
会 学 会 了 思考 。 

子 柳 : 你 是 CSDN 的 著名 博客 ， 你 写 些 什么 内 容 ? 

放 丛 : 现在 半年 我 会 写 两 到 三 篇 ， 写 Blog 的 方式 是 当 我 做 了 一 次 
深入 的 优化 ， 或 者 有 比较 大 的 积累 之 后 ， 我 才 会 去 写 。 现 在 跟 以 前 不 
同 ， 平 单 不 会 去 写 一 些 入 门 性 的 内 容 ， 因 为 这 些 大 家 都 会 了 ， 网 上 也 
有 很 多 。 所 以 更 新 的 速度 比较 慢 ， 但 我 还 是 能 保证 质量 。 

子 柳 : 你 对 工程 师 有 什么 忠告 ? 

放 丛 : 任何 一 个 公司 ， 不 管用 什么 手段 ， 都 做 不 到 绝对 公平 ， 最 
终 只 会 有 小 部 分 人 得 到 机 会 。 这 个 时 候 去 抱怨 、 愤 怒 都 没有 用 的 ， 只 
有 自己 不 断 地 努力 争取 机 会 才 行 。 

作为 孩子 父 杀 


子 柳 : 你 的 孩子 现在 2 岁 半 ， 有 孩子 之 后 ， 你 的 生活 有 了 什么 转 
变 ? 

放 翁 : 时 间 方 面 会 有 很 大 限制 ， 我 的 生活 方式 也 改变 了 。 以 前 我 
是 很 有 规律 地 早上 做 运动 ， 晚 上 早 睡 。 现 在 很 少 能 在 12 点 之 前 睡觉 
运动 也 减少 了 。 晚 上 下 班 要 挤 一 部 分 时 间 给 孩子 ， 等 他 睡觉 后 ， 我 才 
有 时 间 做 点 自己 的 事情 。 

子 柳 : 有 了 孩子 之 后 ， 心 态 方面 有 什么 变化 ? 

放 翁 : 有 了 孩子 之 后 ， 我 发 现 孩子 很 锻炼 人 的 耐心 ， 小 孩儿 会 无 
理 取 闹 ， 但 我 们 不 能 跟 孩子 一 般 见识 ， 要 好 好 应 付 ， 这 样 我 的 心态 会 
很 好 ， 这 对 工作 也 一 样 有 益 ， 但 我 在 这 方面 转变 得 还 不 够 。 另 一 广 
面 ， 有 了 家 庭 ， 我 工作 的 意义 就 会 变 得 不 一 样 ， 我 要 为 这 个 家 庭 负 更 
大 的 责任 ， 对 自己 的 要 求 更 高 了 。 

子 柳 : 你 对 孩子 的 未 来 有 什么 期 望 

放 翁 : 没有 太 多 的 期 望 ， 希 望 能 身体 健康 ， 长 大 后 能 做 自己 喜欢 
做 的 事情 。 你 会 推荐 他 干 我 们 这 一 行 吗 ? ) 这 个 看 他 自己 的 选择 
了 ， 要 是 他 喜欢 ， 我 会 支持 ， 若 他 喜欢 做 别 的 ， 我 也 一 样 支持 他 。 

子 柳 : 你 把 TOP 也 当 作 自己 的 孩子 ， 这 是 一 种 什么 样 的 心态 ? 

放 翁 : 开放 平台 正好 与 我 的 小 孩 出 生 的 时 间 差不多 ， 真 的 要 把 自 
己 的 产品 当 小 孩 一 样 养 ， 我 们 不 能 生 完了 就 扔 掉 ， 要 为 他 的 成 长 负 
责 。 不 管 小 孩子 有 什么 不 好 的 地 方 ， 他 的 脾气 会 不 好 ， 身 体会 出 问 
题 ， 但 是 我 们 要 有 责任 去 帮助 他 成 长 ， 帮 他 去 解决 问题 ， 不 能 用 一 种 
旁观 者 的 心态 去 看 。 

作为 美女 的 老公 

子 柳 : 作为 一 个 技术 男 ， 你 是 怎么 吸引 到 老婆 的 ? 放 翁 : 跟 我 老 
婆 认 识 到 结婚 ， 也 是 一 件 查 奇怪 的 事情 。 怎 么 奇怪 呢 ? 就 是 在 东方 通 
信 的 时 候 ， 有 人 给 我 介绍 女 朋友 ， 是 一 个 女孩 子 的 同学 ， 她 帮 我 张 
罗 ， 但 我 不 喜欢 她 的 同学 ， 拒 绝 掉 了 。 后 来 反倒 越 来 越 喜欢 帮 我 张罗 
这 位 ， 然 后 就 ….. 哈 哈 。 我 老婆 脾气 很 好 ， 我 很 喜欢 。 要 说 他 看 中 我 
的 应 该 是 我 还 比较 实在 一 点 ， 感 觉 比较 可 靠 吧 。 

子 柳 : 工作 这 么 忙 ， 交 给 家 庭 的 时 间 会 比较 少 ， 怎 么 平衡 工作 和 
生活 ? 


放 丛 : 平时 家 里 有 爸 妈 在 帮 着 带 孩 子 ， 所 以 减轻 了 很 多 压力 ， 晚 
上 不 想 让 父母 太 辛 苦 ， 会 花 一 个 小 时 左右 的 时 间 带 孩子 ， 周 末 我 会 抽 
出 一 天 的 时 间 专 门 陪 孩子 玩 。 

子 柳 : 老婆 脾气 这 么 好 ， 会 不 会 为 琐事 而 争吵 ， 怎 么 解决 ? 

放 翁 : 也 会 的 ， 很 多 时 候 都 是 为 了 一 些 琐碎 的 事情 而 吵 。 我 想 这 
也 是 一 种 磨合 ， 只 要 不 是 太 过 分 ， 慢 慢 就 会 产生 默契 。 我 有 一 点 不 太 
好 ， 生 气 的 时 候 喜 欢 冷 处 理 ， 就 是 不 搭理 人 ， 时 间 久 了 也 就 好 了 。 

子 柳 : 老婆 是 网 购 达 人 ， 你 起 到 了 什么 作用 ? 

放 丛 : 其 实 我 来 阿里 巴巴 之 前 ， 帮 有 我 老婆 开 过 店 (2006 年 开 
的 ) ， 还 帮 她 送 过 货 ， 后 来 就 不 开 了 ， 所 以 这 方面 她 比 我 还 擅长 ， 不 
用 我 培养 ， 本 身 就 很 熟悉 。 〈 反 对 你 老婆 买 太 多 的 东西 吗 ? ) 其 实 她 
买 自己 的 东西 我 没有 什么 意见 ， 买 家 里 用 的 有 些 东 西 我 会 有 反对， 本 身 
家 也 不 是 很 大 ， 买 很 多 东西 太 占 地 方 。 

业余 生活 丰富 多 彩 

子 柳 : 你 是 一 个 K 歌 达 人 ， 也 喜欢 户外 运动 ， 这 与 很 多 宅男 程序 
员 不 同 。 

放 丛 : 以 前 读书 的 时 候 ， 没 现在 这 么 多 娱乐 项 目 ， 学 校 旁 边 有 小 
歌厅 ，15 元 包 一 个 小 桌子 ， 喝 茶 唱歌 ， 台 下 有 很 多 张 小 桌 子 ， 你 唱 一 
首 ， 大 家 都 鼓掌 ， 这 种 感觉 不 错 。 很 多 程序 员 都 比较 宅 ， 我 觉得 大 家 
最 好 是 去 做 户外 运动 ， 天 和 气 不 好 的 时 候 去 唱 唱 歌 ， 也 能 够 让 你 舒展 身 
心 ， 把 压力 也 排解 出 来 了 。 

子 柳 : 作为 土生 土 长 的 杭州 人 ， 给 我 们 推荐 点 玩 的 地 方 吧 。 

放 丛 : 在 杭州 ， 如 果 你 不 出 去 玩 玩 ， 就 太 可 惜 了 。 我 推荐 大 家 去 
走 走 云 栖 竹 径 、 虎 跑 后 山 、 江 洋 上 ， 这 些 地 方 的 人 比较 少 ， 很 安静 ， 
能 够 让 你 放松 身心 。 长 一 点 的 路 线 是 从 古 荡 上 去 到 北 高 峰 ， 然 后 到 宋 
城 。 

子 柳 : 现在 你 的 家 庭 美 满 ， 事 业 顺 利 ， 你 后 面 的 人 生 追 求 是 什 
么 ? 

放 丛 : 我 曾经 说 过 ， 如 果 有 一 天 我 离开 淘宝 ， 我 会 选择 一 个 小 公 
司 或 一 个 创业 团队 ， 把 一 个 东西 从 小 做 到 大 。 这 样 什 么 都 经 历 过 了 ， 


事业 方面 就 满足 了 。 然 后 我 希望 能 到 世界 各 地 走 走 ， 这 辈子 也 比较 完 


整 了 。 


吴 翰 清 一 一 阿里 云集 团 信息 安全 中 心 高 级 安 
全 专家 


吴 翰 清 交友 注 >， 人 称 小 黑 ， 毕 业 于 西安 交通 大 学 少年 班 ， 从 
2000 年 开始 研究 网 络 攻防 技术 。 在 大 学 期 间 创立 了 在 中 国安 全 圈 内 极 
影响 力 的 组 织 “ 幻 影 ?。 从 2009 年 起 ， 加 入 阿里 巴巴 云 计算 有 限 公 
司 ， 负 责 云 计算 安全 、 反 网 络 欺诈 等 工作 ， 是 阿里 巴巴 集团 最 具 价值 
的 安全 专家 之 一 。 

子 柳 : 见 到 安全 专家 ， 我 首先 想到 的 就 是 我 的 电脑 是 否 安全 ， 那 
么 杀毒 软件 能 保证 客户 端 安 全 吗 ? 

吴 翰 清 : 杀毒 软件 似乎 是 个 人 电脑 的 标 配 了 ， 但 这 个 只 能 做 到 “看 
起 来 安全 ”， 要 真正 的 安全 ， 其 实 是 非常 难 的 。 像 流行 的 木马 之 类 的 病 
毒 ， 它 第 一 个 对 付 的 就 是 杀毒 软件 ， 它 在 实施 一 次 攻击 之 前 ， 要 看 是 
不 是 通过 了 360 诺 顿 、 麦 咖啡 等 各 种 杀毒 软件 ， 然 后 才 会 拿 出 来 实施 攻 
击 。 


子 柳 : 这 两 年 出 了 不 少 互联 网 安全 方面 的 问题 ， 企 业 在 面 对 安全 
问题 的 时 候 都 是 非常 害怕 的 ， 可 能 一 下 子 就 会 被 搞 死 ， 你 认为 企业 需 
要 伦 多 少 成 本 在 安全 方面 ? 

吴 翰 清 : 其 实 安全 一 直 紧 随 业 务 发 展 ， 在 你 开展 业务 的 过 程 中 ， 
安全 是 一 直 要 占 一 个 比例 的 ， 但 这 个 比例 不 能 盲目 扩张 ， 要 先 做 最 急 
人 迫 的 事情 。 另 外 也 要 看 行业 ， 有 些 行 业 就 比较 容易 遭受 攻击 ， 例 如 ， 
那些 卖 假 药 的 、 网 游 私 服 之 类 的 ， 这 种 是 最 容易 被 竞争 对 手 攻击 的 。 
像 地 方 论坛 这 种 无 利 可 图 的 就 很 少 会 被 攻击 。 所 以 ， 要 看 你 所 处 的 行 
业 和 企业 的 规模 来 做 安全 方面 的 投入 。 安 全 的 投入 又 分 很 多 方面 ， 例 
如 ， 招 人 、 买 设备 、 买 安全 服务 、 做 评估 等 。 

子 柳 : 安全 方面 的 人 才 还 很 稀缺 ， 有 没有 类 似 云 存储 一 样 的 “ 云 安 
全 ”服务 ? 

吴 翰 清 : 我 们 是 希望 做 到 这 样 一 件 事情 ， 现 在 在 阿里 云 上 面 的 多 
数 是 一 些 中 小 网 站 的 站 长 ， 他 们 没有 太 多 的 钱 投入 到 安全 方面 ， 例 
如 ， 防 DDoS 设 备 ， 最 便宜 的 都 要 几 十 万 元 ， 可 能 他 们 的 网 站 一 年 的 利 
润 也 就 这 么 多 ， 这 个 投入 对 他 们 来 说 就 太 不 值 。 所 以 云 计算 有 个 好 
处 ， 就 是 把 这 么 大 的 一 个 资源 的 投入 切 分 成 很 多 小 份 ， 然 后 按 需 分 
配 。 例 如 ， 如 果 你 使 用 “ 云 安 全 ”的 服务 后 ， 遭 受 多 少 次 攻击 ， 我 们 就 
帮 你 清洗 掉 ， 事 后 按 次 数 收费 ， 这 个 成 本 就 降下 来 了 ， 可 能 你 只 会 “ 消 
费 ” 掉 几 千 元 钱 的 攻击 ， 我 们 把 安全 服务 做 成 一 个 可 以 消费 的 东西 。 

子 柳 : 作为 一 个 黑客 ， 在 成 为 “ 白 帽 子 ” 之 前 ， 是 否 都 会 有 一 段 “ 黑 
帽子 ”的 经 历 ? (解释 : 简单 地 说 ， 白 帽子 是 做 好 事 的 ， 黑 帽子 是 做 坏 
事 的 ) 

吴 翰 清 : 我 不 知道 现在 的 人 是 怎么 样 的 ， 对 我 们 那个 时 代 的 黑客 
来 说 ， 多 多 少 少 都 会 做 一 些 攻 击 或 入 侵 的 事情 ， 这 个 要 看 你 的 出 发 点 
是 什么 ， 如 果 你 是 为 了 找到 网 站 的 漏洞 ， 或 者 是 为 了 做 技术 尝试 ， 进 
去 之 后 不 做 破坏 ， 这 些 我 们 认为 是 好 的 。 (不 过 现在 刑法 修正 案 有 了 
明确 规定 ， 这 种 行为 也 是 违法 的 ， 所 以 不 能 提倡 ) 另外 一 些 人 以 利益 
为 目的 ， 这 就 涉及 黑色 产业 链 了 ， 其 实 这 一 类 人 并 不 一 定 要 掌握 多 深 
的 黑客 技术 ， 有 些 是 猜 别 人 的 密码 ， 甚 至 先 取得 别人 的 信任 ， 发 给 对 
方 一 个 木马 ， 这 就 不 是 黑客 技术 了 ， 而 是 骗术 。 


我 们 在 招 人 的 时 候 就 很 小 心 ， 要 看 他 以 前 做 过 什么 ， 历 史 不 清白 
的 是 不 能 要 的 。 

子 柳 : 前 些 年 有 中 美 黑客 大 战 ， 有 卖 熊 胆 的 网 站 被 黑 ， 有 卖 民心 
药 的 网 站 也 被 黑 ， 这 些 你 都 参与 过 吗 ? 

吴 翰 清 : 我 现在 不 太 关 注 这 些 。 往 往 是 一 些 年 轻 人 ， 他 们 比较 愤 
青 ， 看 到 这 些 网 站 就 顺手 试 试 ， 不 能 说 他 们 的 技术 水 平 有 多 高 ， 只 是 
这 些 网 站 在 安全 方面 做 得 太 差 了 。 

子 柳 : 在 阿里 期 间 ， 你 参与 了 哪些 黑 日 帽子 之 间 的 较量 ? 

吴 翰 清 : 很 多 人 可 能 会 认为 黑客 之 间 的 较量 很 酷 ， 大 家 你 来 我 
往 ， 刀 光 剑 影 。 其 实 这 都 是 电影 给 大 家 的 误导 ， 现 实 中 看 来 很 简单 ， 
我 对 自家 的 网 站 做 好 各 种 防护 ， 有 人 攻 一 下 ， 进 不 来 就 走 了 ， 或 者 他 
们 进来 了 ， 看 到 点 什么 东西 ， 走 了 。 有 朋友 向 我 们 报告 过 漏洞 ， 几 个 
互联 网 公司 的 安全 团队 都 是 有 交流 的 ， 有 时 候 我 们 也 会 告诉 腾讯 、 百 
度 ， 他 们 的 网 站 有 哪些 漏洞 。 

其 实 最 头疼 的 是 那些 做 黑色 产业 链 的 ， 主 要 是 钓鱼 和 欺诈 ， 这 些 
人 其 实 不 能 被 称 为 真正 的 黑客 ， 他 们 偶尔 也 会 利用 网 站 的 一 些 漏洞 ， 
或 者 用 木马 ， 他 们 用 的 是 半 骗 半 攻 击 的 形式 。 我 在 这 方面 一 直 投 入 了 
很 大 的 精力 在 做 ， 帮 助 淘宝 和 支付 宝 减少 这 些 业 务 方面 的 安全 问题 。 
以 前 一 个 钓鱼 网 站 出 来 ， 可 能 它 能 够 存活 半 个 月 ， 没 有 人 去 管 它 。 现 
在 经 过 我 们 的 努力 ， 它 出 来 几 分 钟 就 会 被 我 们 嗅 探 到 ， 甚 至 他 在 旺旺 
上 发 一 次 网 址 ， 这 个 网 站 就 失效 了 ， 他 只 能 骗 一 次 。 

子 柳 : 现在 有 没有 比较 令 人 头疼 的 水 平 比较 高 的 黑 帽 子 ? 

吴 翰 清 : 比较 少 ， 这 个 圈子 里 的 人 就 几 个 去 向 ， 要 么 去 大 一 点 的 
互联 网 企业 ， 要 么 去 安全 厂商 ， 要 么 被 国家 队 招 去 做 国家 安全 方面 的 
工作 。 

子 柳 : 对 于 白 帆 子 黑客 来 说 ， 有 哪些 信条 或 原则 呢 ? 

吴 翰 清 : 首先 要 有 职业 道德 ， 然 后 要 假设 一 切 都 是 邪恶 的 ， 我 们 
自己 的 人 也 不 能 完全 相信 ， 要 通过 技术 手段 来 保证 ， 所 有 人 的 操作 都 
有 记录 ， 做 审计 ， 然 后 收 权限 ， 我 们 自己 也 只 有 很 少 几 个 人 有 服务 器 
的 权限 ， 保 证 我 们 目 己 也 黑 不 挥 公司 。 


子 柳 : 在 你 的 书 《 白 帽子 讲 Web 安 全 》 中 有 很 多 攻防 演示 的 案 
例 ， 会 不 会 担心 被 人 学 去 做 坏事 ? 

吴 翰 清 : 任何 事物 都 有 两 面 性 。 首 先 ， 我 写 的 内 容 都 是 互联 网 上 
公开 的 ， 我 的 每 一 个 引用 都 能 在 互联 网 上 找到 。 如 果 一 个 人 真 的 想 去 
做 坏事 ， 他 在 互联 网 上 很 方便 就 能 找到 。 另 外 ， 就 如 同 我 们 会 说 开源 
软件 更 安全 ， 就 是 因为 它 的 代码 都 公开 了 ， 我 们 都 能 看 到 其 中 的 内 
容 。 对 于 黑客 技术 也 是 一 样 的 ， 这 个 武器 放 在 这 里 ， 攻 击 方 案 放 在 这 
里 ， 你 知道 怎么 去 攻击 ， 也 就 知道 怎么 去 防御 。 

子 柳 ; 每 一 个 新 技术 的 出 现 总 会 有 人 找到 漏洞 进行 攻击 ， 攻 与 防 
似乎 是 自然 界 生态 体系 的 基础 ， 在 互联 网 行业 ， 这 个 生态 平衡 吗 ? 

吴 翰 清 : 只 要 技术 在 不 断 地 发 展 ， 就 会 有 新 的 安全 问题 出 来 ， 这 
就 像 自然 界 一 样 ， 达 到 了 一 种 生态 平衡 。 (对 于 攻 的 人 ， 他 只 需要 找 
到 一 两 个 漏洞 ， 对 于 防 的 人 ， 要 找 出 所 有 的 漏洞 ， 把 它 补 上 ， 这 会 不 
会 很 辛苦 ? ) 的 确 会 很 辛苦 ， 而 且 有 的 时 候 必须 跟随 攻 的 人 ， 他 们 在 
研究 哪些 漏洞 ， 你 也 要 去 研究 它 。 例 如 ， 黑 帽子 最 近 在 研究 手机 ， 你 
就 必须 跟着 去 研究 手机 ， 等 他 研究 云 计算 了 ， 你 也 得 赶紧 去 研究 云 计 
算 ， 而 且 还 要 比 他 们 研究 得 更 透彻 ， 赶 在 他 们 下 手 之 前 ， 把 漏洞 补 
La 

子 柳 ; 作为 后 台 人 员 ， 系 统 出 了 问题 才 会 想到 你 们 ， 没 有 问题 似 
乎 就 不 知道 你 们 的 存在 ， 工 作 的 成 就 感 来 自 哪 里 ? 如 何 评价 自己 的 业 
绩 ? 

吴 翰 清 : 我 们 确实 为 安全 怎么 量化 这 个 问题 头疼 了 很 长 时 间 ， 后 
来 我 们 引入 了 一 些 体系 化 的 东西 ， 把 安全 融入 整个 开发 流程 中 。 在 软 
件 研发 流程 中 的 每 一 个 角色 都 要 跟 安 全 打交道 ， 我 们 去 培训 他 们 要 怎 
么 做 、 不 能 怎么 做 ， 这 样 可 以 让 他 们 感觉 到 我 们 的 存在 ， 呵 呵 。 另 外 
的 一 些 量化 手段 包括 今天 我 们 发 现 了 多 少 安全 漏洞 ; 到 下 一 个 月 这 些 
漏洞 是 变 多 了 还 是 变 少 了 ; 工程 师 写 出 来 的 代码 是 变 好 了 还 是 变 坏 
Te 

我 们 的 成 就 感 主要 体现 在 两 方面 ， 一 是 公司 的 产品 是 不 是 越 来 越 
好 了 ? 二 是 我 们 在 工作 的 过 程 中 攻克 了 很 多 技术 上 的 难题 ， 这 个 纯粹 
属于 技术 上 的 成 就 感 。 


子 柳 : 你 给 出 了 一 整套 的 互联 网 安全 解决 方案 ， 但 需要 很 多 部 门 
和 角色 参与 ， 你 怎么 推广 你 们 的 安全 技术 ? 

吴 翰 清 : 也 没有 特别 好 的 办 法 ， 我 们 专业 的 术语 叫做 SDL (安全 
开发 流程 ，， 它 依赖 于 整个 公司 的 软件 工程 的 成 熟 程度 。 这 个 公司 的 
软件 工程 做 得 越 成 熟 ， 越 容易 推动 这 些 东 西 ， 在 B2B 有 一 些 比较 成 功 
的 实施 经 验 ，SQA 会 帮 有 我 们 把 每 个 环节 都 打通 ， 我 们 只 需要 告诉 SQA 
每 个 环节 做 什么 。 在 其 他 公司 有 些 开发 过 程 还 有 点 乱 ， 就 不 太 好 推 ， 
我 们 培训 所 有 的 工程 师 ， 告 诉 他 们 在 哪个 点 做 什么 事 ， 项 目 发 布 之 前 
要 给 安全 工程 师 签字 。 

子 柳 : 大 学 上 的 是 少年 班 ， 在 阿里 巴巴 成 为 最 年 轻 的 专家 (23 岁 
就 是 安全 专家 ) ， 在 外 人 看 来 ， 你 是 一 个 天 才 ， 你 怎么 看 自己 的 成 长 
之 路 ? 

吴 翰 清 : 上 少年 班 的 事情 ， 我 认为 最 好 还 是 不 要 拔 摆 助长 ， 我 在 
少年 班 的 很 多 同学 现在 发 展 得 并 不 是 很 好 。 那 时 候 ， 周 围 都 是 年 龄 比 
较 大 的 同学 ， 谈 恋爱 都 找 不 到 对 象 ， 呵 呵 。 我 们 那个 年 龄 的 学 生 都 没 
有 自制 能 力 ， 到 了 学 校 之 后 就 控制 不 了 自己 想 去 玩 的 那 种 心态 ， 所 以 
这 样 并 不 好 。 后 来 做 安全 完全 出 于 兴趣 ， 我 觉得 上 少年 班 是 为 父母 上 
的 ， 而 来 阿里 做 安全 确实 是 我 自己 想 要 的 ， 能 做 到 今天 这 个 样子 ， 也 
说 不 上 有 多 大 成 融 ， 主 要 还 是 因为 我 目 己 的 兴趣 。 

子 柳 : 在 你 的 书 中 ， 你 说 过 来 阿里 巴巴 面试 的 时 候 ， 面 试 官 让 你 
展示 一 下 技术 ， 你 把 公司 的 办 公 内 网 给 黑 了 ， 这 个 是 怎么 做 到 的 ? 

吴 翰 清 : 这 个 不 是 公司 的 内 网 网 站 ， 是 办 公用 的 网 络 ， 当 时 我 和 
几 个 朋友 基本 上 把 浙江 这 边 的 网 络 提前 控制 了 ， 这 边 主要 都 是 电信 的 
网 络 。 

子 柳 : 给 安全 方面 刚 上 路 的 技术 人 员 一 些 建议 吧 ? 

吴 翰 清 : 从 基本 功 做 起 ， 研 究 常 见 的 漏洞 ， 把 它 查 出 来 ， 并 去 分 
析 它 ， 不 要 用 它 来 做 坏事 。 另 外 ， 去 看 看 公开 的 漏洞 ， 研 究 一 下 漏洞 
的 利用 技巧 。 


云 铮 一 一 数据 平台 与 产品 部 资深 技术 专家 


张 清 ， 淘 宝 人 花 名 为 云 铮 。2002 年 毕业 于 浙江 大 学 计算 机 系 ，2003 
年 初 加 入 阿里 巴巴 ， 成 功 创建 了 阿里 巴巴 DW (数据 仓库 ) ， 经 历 了 
阿里 DW 从 创建 到 成 熟 运用 。2005 年 ， 淘 宝 数据 开始 启动 ， 调 任 淘 宝 
打造 淘宝 数据 平台 体系 ， 推 动 商业 智能 体系 建设 。 对 国内 外 最 新 数据 
技术 狂热 ， 在 和 国内 外 业界 行家 交流 及 在 阿里 、 淘 宝 的 实战 中 ， 灶 合 
所 学 所 见 ， 无 门 无 派 ， 注 重 实效 ， 自 成 一 套 淘 宝 数据 体系 建设 和 运用 
的 实战 方法 。 

子 柳 : 恭喜 你 当选 大 淘宝 技术 委员 会 数据 分 会 的 新 任 会 长 ， 今 
数据 分 会 有 哪些 工作 计划 ? 

云 铮 : 今年 (2012 年 ) 一 个 很 重要 的 工作 就 是 响应 这 个 分 会 成 员 
的 呼声 ， 加 入 这 里 到 底 是 干什么 的 ? 写 Job Model (任职 能 力 模型 ) 、 
参加 晋升 评审 吗 ? 不 仅仅 是 这 些 ， 要 让 他 们 有 5 引路 人 ， 有 方向 感 。 数 


据 领 域 有 很 多 模块 ， 不 能 说 让 大 家 做 了 几 年 还 局 限 在 一 个 格子 里 ， 要 
把 信息 互通 ， 把 思维 打开 。 

第 二 个 就 是 数据 技术 的 新 趋势 ， 这 个 是 每 年 必 做 的 ， 交 流 的 范围 
也 会 越 来 越 广 ， 越 来 越 深 入 。 

第 三 个 是 把 整个 集团 的 数据 打通 。 整 个 集团 的 数据 团队 有 很 多 ， 
B2B、 支 付 宝 、 阿 里 云 、 阿 里 金融 、 淘 宝 都 在 做 ， 这 样 力量 比较 分 
散 ， 现 在 来 看 有 必要 把 这 些 打 通 ， 形 成 合力 ， 然 后 几 个 公司 又 各 自 有 
优势 领域 。 如 果 我 们 打 成 一 股 强 ， 阿 里 集团 的 数据 在 业界 就 没有 人 能 
够 撼动 。 

子 柳 : 淘宝 网 数据 平台 是 你 们 一 手 带 起 来 的 ， 请 讲述 一 下 这 个 音 
门 的 发 展 历程 。 

云 铮 : 我 来 的 时 候 是 一 个 数据 分 析 部 ， 那 时 候 有 天 宏 、 小 龙 女 等 
几 位 同事 做 数据 分 析 ， 我 和 正德 几 个 工程 师 提 供 支持 ， 鼓 的 数据 库 ， 
建 数据 仓库 。 我 们 最 初 是 先 有 业务 ， 没 有 技术 ， 根 据 业 务 需 求 做 技 
术 。 一 开始 用 一 个 单机 的 Oracle， 然 后 经 过 一 次 组 织 的 调整 之 后 ， 数 
据 团队 的 几 个 工程 师 归 七 公 带 了 ， 这 个 时 候 开 始 步 入 正轨 ， 从 单机 的 
Oracle 到 4 个 节点 、16 个 节点 、20 个 节点 。 到 20 个 节点 的 时 候 达 到 了 
Oracle 集 群 的 极限 ， 这 个 时 候 已 经 是 全 球 最 大 的 Oracle 集 群 了 

(Amazon 美 国 是 17 个 节点 ) 。 这 时 我 们 也 发 现 商业 的 工具 已 经 被 我 们 
到 了 极限 ， 接 下 来 怎么 办 呢 ? 我 们 只 好 自己 革 自 己 的 命 ， 把 Oracle 
逐步 蔡 换 掉 ， 目 前 已 完成 了 这 个 工作 。 

( 子 柳 : 这 与 在 前 台 蔡 换 Oracle 有 什么 不 同 吗 ? ) 这 里 面 有 很 多 
复杂 的 业务 ， 它 的 数据 从 前 台 拉 过 来 。 我 们 本 身 的 环境 在 变 ， 前 台 的 
环境 也 在 变 ， 新 迁 的 环境 是 Hadoop 平 台 ， 一 开始 我 们 对 它 也 不 是 很 熟 
悉 。 这 里 有 三 个 变量 同时 在 变 ， 如 果 能 控制 一 个 不 变 的 话 ， 还 好 做 一 
点 ， 例 如 ， 等 前 人 台 变 完 ， 我 们 再 变 ， 但 这 样 业 务 不 允许 ， 我 们 对 时 效 
性 的 要 求 非常 高 。 在 “五 彩 石 ” 项 目 中 ， 前 台 上 线 的 当天 ， 我 们 跟着 上 
线 ， 必 须 保 持 步调 一 致 。 我 们 去 找 电信 行业 、 金 融 行业 、 世 界 500 强 企 
业 学 习 ， 发 现 他 们 的 前 台 业 务 做 变革 时 ， 后 台数 据 的 工作 全 停 了 ， 前 
台 交 付 好 后 再 做 数据 ， “为 何 要 同步 做 ? 本 身 就 不 应 该 嘛 ”。 没 办 法 ， 
只 能 自己 去 想 办 法 解决 这 样 的 问题 ， 最 后 我 们 解决 了 这 样 的 问题 ， 这 
在 业界 是 没 人 做 过 的 ， 这 是 一 个 非常 宝贵 的 经 验 。 


随 着 这 些 创 造 性 的 工作 的 成 功 ， 整 个 团队 也 被 锻炼 出 来 了 ， 再 全 
到 什么 新 的 问题 不 会 害怕 了 ， 总 有 办 法 解决 的 。 在 发 展 的 过 程 中 还 有 
一 个 比较 大 的 事件 ， 就 是 阿里 妈妈 业务 的 合并 。 阿 里 妈妈 是 一 个 独立 
的 公司 ， 它 从 前 人 台 到 后 台 有 一 整套 的 系统 ， 前 端 要 跟 淘 宝 对 接 ， 后 端 
所 有 的 数据 也 都 要 整合 。 整 合 的 细节 很 复杂 ， 最 终 是 成 功 整合 了 ， 前 
端 形 成 了 量子 统计 和 数据 魔方 两 个 产品 ， 后 面 数 据 的 系统 整合 
Hadoop 的 一 个 集群 。 当 时 阿里 妈妈 有 四 五 个 集群 ， 数 据 鼓 的 来 鼓 的 
去 ， 其 时 效 性 、 运 维 的 成 本 都 非常 高 。 整 合成 一 个 集群 以 后 统一 管 
理 、 调 度 、 维 护 、 监 控 ， 慢 慢 地 ， 报 警 越 来 越 少 ， 大 家 集中 力量 做 业 
务 、 平 台 ， 这 在 当时 是 一 个 非常 关键 的 工作 ， 集 中 力量 办 了 一 件 大 
事 。 

俗话 说 “分 久 必 合 ， 合 久 必 分 ”。 近 两 年 ， 我 们 又 孵 化 出 了 一 些 团 
队 和 产品 ， 并 进驻 到 了 各 个 子 公 司 。 今 年 (2012 年 ) 又 要 在 整个 集团 
的 范围 内 ， 和 阿里 云 一 起 形成 一 个 官方 的 组 织 ， 牵 头 促成 < 数据 分 享 第 
一 平台 ”模式 创新 工作 ， 就 是 现在 的 “冰火 乌 ?" 项 目 。 这 里 面 汇集 了 集团 
里 最 大 的 两 个 数据 系统 一 一 “飞天 ”和 Hadoop， 这 个 团队 也 包含 了 集团 
里 做 数据 的 几乎 所 有 高 P 级 工程 师 和 核心 架构 师 ， 是 今年 集中 优势 兵 
力 协同 做 大 事 ， 相 信 这 个 项 目 能 锻炼 出 更 优秀 、 更 具备 大 局 观 视角 的 
一 批 数据 技术 专家 。 

子 柳 : 数据 平台 经 过 这 么 多 年 的 投入 ， 目 前 产生 了 什么 样 的 效 
蔓 ? 

云 铮 : 最 简单 的 一 个 考量 方式 就 是 这 些 数据 有 没有 变 成 价值 ， 数 
据 魔方 和 量子 统计 是 把 数据 变 成 钱 的 两 个 产品 ， 现 在 收入 还 不 错 。 但 
并 不 是 说 能 赚 到 的 钱 就 是 它 的 价值 ， 这 些 只 是 我 们 的 一 些 尝 试 ， 我 们 
才刚 刚 开 始 探索 数据 的 价值 ， 它 未 来 是 什么 我 们 还 不 知道 ， 它 未 来 的 
价值 更 是 不 可 考量 。 

子 柳 : 我 们 的 数据 计算 平台 与 Google、Amazon 有 什么 异同 ? 

云 铮 : 从 相同 点 看 ， 这 个 级 别 的 公司 做 数据 ， 从 宏观 上 看 都 是 分 
布 式 的 。Google 做 得 早 一 点 ， 他 们 自己 开发 的 Bigtable、GFS， 从 分 布 
式 存 储 到 分 布 式 计算 开发 了 一 系列 的 产品 ， 用 在 自己 的 搜索 中 。 
Amazon 和 Google 又 不 太一 样 ，Amazon 采 用 虚拟 机 的 方式 ， 自 己 给 别 


人 搭 OPS， 用 虚拟 机 租赁 的 方式 做 云 计 算 ， 自 己 也 有 一 些 业 务 数据 放 
在 上 面 。 

淘宝 采用 在 开源 的 分 布 式 平台 上 面 用 Patch 的 方式 来 做 ， 从 “云梯 ” 
到 “飞天 ”这 样 的 平台 。 分 布 式 的 理念 是 相通 的 ， 我 们 拥有 全 套 “ 飞 天 ” 
系统 的 自主 知识 产权 ， 有 不 少 精 妙 的 设计 ， 目 主 设计 的 后 劲 很 足 。 

另外 一 个 很 重要 的 不 同 点 是 里 面 的 数据 是 不 同 的 ， 数 据 的 价值 也 
是 不 同 的 。 淘 宝 把 中 国电 子 商 务 从 零 开 始 到 现在 ， 几 乎 所 有 的 数据 都 
包含 了 ， 有 B2B、B2C 和 C2C 的 商品 数据 ， 以 及 交易 数据 和 支付 数据 。 
而 Amazon 只 有 B2C 的 数据 ，Google 没 有 商业 数据 ， 都 是 搜索 的 信息 。 
淘宝 的 数据 从 量 和 质 上 面 都 非常 高 ， 而 且 更 适合 中 国 的 国情 ， 这 上 面 
是 中 国人 的 消费 数据 。 这 些 数据 的 价值 需要 持续 地 创新 和 在 更 大 的 生 
态 链 中 去 寻找 和 挖掘 。 

子 柳 : 我 们 的 数据 现在 达到 了 一 个 什么 样 的 规模 ? 

云 铮 : 我 们 的 数据 每 日 新 增长 达到 100TB 左 右 ， 通 过 极限 存储 等 
创新 的 技术 手段 ， 控 制 净 增 量 快速 增长 的 势头 。 

子 柳 : 作为 一 名 互联 网 技术 老 乌 ， 你 的 成 长 之 路 是 什么 样 的 ? 

云 铮 : 理想 主义 ， 兴 趣 + 执 著 ， 看 准 一 个 方向 后 ， 无 论 是 顺境 还 
是 逆境 ， 都 要 不 断 地 努力 ， 不 浪费 时 间 和 机 会 。 

入 职 初期 ， 我 对 数据 非常 有 兴趣 ， 然 后 就 是 马 总 在 阿里 巴巴 成 立 
初期 就 请 了 前 亚马逊 首席 科学 家 Dr.Andreas Weigend 给 公司 介绍 了 数据 
的 价值 和 重要 性 。 昌 然 当 时 没有 完全 理解 ， 不 过 当时 任 着 一 股 冲劲 ， 
就 持续 做 下 来 了 。 随 着 公司 的 发 展 ， 从 B2B DW 到 淘宝 数据 平台 ， 阿 
里 云 成 立 后 ， 开 始 和 阿里 云 一 起 看 着 飞天 系统 从 梦想 逐步 变 成 现实 ， 
经 历数 据 系统 发 展 的 这 些 宝贵 经 历 ， 有 机 遇 在 里 面 ， 更 需要 持续 的 执 
著 和 努力 ， 我 庆幸 的 是 我 们 有 一 批 在 这 个 环境 里 成 长 起 来 的 核心 数据 
技术 人 员 。 

子 柳 : 从 2003 年 加 入 阿里 巴巴 到 现在 ， 在 技术 岗位 上 做 了 9 年 ( 
2012 年 止 ) ， 历 经 了 多 少 次 主动 或 被 动 的 变迁 ? 你 怎么 看 待 这 些 
动 ? 

云 铮 : 从 DBA 转 型 做 DW， 这 个 原因 应 该 是 公司 开始 启动 搞 数据 
时 ， 没 有 合适 的 人 ， 当 时 和 数据 最 相关 的 应 该 是 DBA 这 个 岗位 。 


三 
圭 
ES 
>< 


此 ， 我 有 幸 被 抽 到 这 个 项 目 组 ， 开 始 了 Alibaba 数 据 仓库 的 第 一 步 建 
]。 

第 二 次 是 从 B2B 到 淘宝 ， 应 该 是 2005 年 下 半年 ， 这 次 是 主动 的 ， 
当时 B2B 的 数据 仓库 已 经 投入 使 用 ， 基 本 架构 完成 ， 业 务 也 跑 顺 了 ， 
我 也 成 为 B2B 数 据 仓 库 建 设 的 核心 成 员 ， 基 本 上 很 顺手 了 。 当 时 的 淘 
宝 业 务 变化 很 大 ， 从 行业 经 验 上 讲 ， 做 数据 仓库 失败 的 可 能 性 很 大 ， 
而 且 难 度 高 ， 于 是 决定 来 淘宝 从 无 做 起 。 

淘宝 的 数据 发 展 的 确 很 快 ， 业 务 也 在 不 断 变化 ， 不 过 这 样 的 环境 
正好 促使 了 数据 平台 的 快速 发 展 ， 随 着 淘宝 前 台 几 次 大 的 重 构 、 拆 

、 合 并 ， 数 据 基 本 上 每 年 都 会 遇 到 以 前 完全 没有 遇 到 过 的 问题 和 挑 
战 ， 但 每 次 都 顺利 过 关 。 随 着 淘宝 五 彩 石 项 目的 成 功 ， 以 及 广告 数据 
平台 和 淘宝 数据 平台 合并 完成 ， 业 务 开始 迅速 发 展 ， 成 为 数据 应 用 平 
台 的 原始 驱动 力 ， 这 个 时 间 段 的 技术 和 业务 发 展 进入 高 峰 期 。 

说 到 我 对 变动 的 看 法 ， 我 一 直 是 一 个 喜欢 挑战 的 人 ， 我 认为 有 变 
动 是 好 事 ， 这 会 让 人 经 历 更 多 ， 而 且 应 该 主动 创造 变化 ， 比 如 平台 稳 
定 了 ， 系 统 理 顺 了 ， 是 不 是 就 应 该 刀枪 入 库 ， 马 放 南 山 了 ? 不 是 的 ， 
应 该 从 更 深 、 更 全 的 角度 去 提出 新 的 要 求 和 新 的 梦想 ， 并 进一步 去 实 
现 oO 

子 柳 : 给 技术 刚 起 步 的 人 员 一 些 技术 成 长 的 建议 吧 。 

云 铮 : 兴趣 是 最 好 的 老师 ， 坚 持 是 达到 梦想 的 唯一 途径 ， 当 然 ， 
在 个 人 发 展 的 不 同 阶段 寻找 到 合适 的 导师 很 重要 ， 看 准 方向 会 事 半 功 
音 。 在 刚刚 参加 工作 还 没有 形成 自己 的 判断 时 ， 方 向 有 两 个 来 源 ， 一 
个 是 个 人 的 兴趣 ， 一 个 是 找 一 个 你 非常 佩服 且 能 掌握 未 来 方向 的 人 ， 
当然 ， 如 果 这 两 者 正好 重合 ， 那 么 剩 下 的 就 是 脚踏实地 坚持 。 


小 马 一 一 淘宝 UED 前 端 通用 平台 高 级 技术 专 
家 


赵 泽 欣 ， 花 名 为 小 马 ，2006 年 10 月 加 入 淘宝 网 ， 加 入 淘宝 之 前 ， 
基本 上 都 在 创业 公司 中 度 过 ， 创 业 项 目 繁杂 ， 角 色 兼 顾 产 品 开 发 、 售 
前 咨询 、 售 后 支持 、 客 户 培训 。 加 入 淘宝 后 ， 他 成 了 全 网 第 一 位 前 端 
工程 师 ， 参 与 了 旺 铺 、 收 藏 夹 、 物 流 、Web 旺 旺 和 P4P 等 重要 产品 的 前 
端 开 发 ， 对 淘宝 整个 交易 流程 做 了 系统 的 前 端 重 构 。 先 后 主导 并 产 出 
了 最 初 的 前 端 JavaScript 类 库 TBra， 组 织 虚拟 团队 优化 淘宝 各 关键 页 面 
的 前 端 性 能 ， 负 责 技 术 委 员 会 速度 小 组 的 工作 。2010 年 开始 带领 前 端 
架构 团队 ， 负 责 前 端 通用 框架 的 研发 与 推广 ，UDC 核 心 业务 支持 和 前 
端 质量 保障 体系 的 建设 ， 曾 译 有 《JavaScript 语 言 精粹 》 等 经 典 著作 。 

子 柳 : 作为 D2 (前 端 技术 论坛 ) 的 早期 主要 发 起 人 ， 当 时 举办 D2 
的 初衷 是 什么 ? 开始 时 举办 的 情况 如 何 ? 

小 马 : 当时 的 环境 是 这 样 的 ， 前 端的 从 业 人 员 越 来 越 多 ， 行 业 也 
越 来 越 趋 于 成 熟 ， 而 这 种 属于 前 端 从 业 人 员 的 会 议 却 很 少 ， 所 以 就 想 
到 是 不 是 可 以 组 织 一 场 这 样 的 活动 让 更 多 的 同行 聚 在 一 起 呢 ? 所 以 D2 
就 诞生 了 。 算 上 今年 (2012 年 ) 的 ADC 技术 嘉年华 ， 已 经 是 D2 举办 
的 第 七 届 了 ， 而 回想 第 一 届 D2， 当 时 我 们 的 会 场 等 条 件 其 实 都 是 相对 


简陋 的 ， 我 还 记得 第 一 届 的 参加 人数 也 就 是 70 多 人 ， 发 展 到 现在 ，D2 
每 次 举办 活动 时 参加 的 人 数 和 业界 的 知名 度 都 让 我 们 感到 很 欣慰 。 

子 柳 : 今年 (2012 年 ) 的 “ADC 技术 嘉年华 "是 第 二 届 ， 去 年 也 是 
叫 “ 淘 宝 技术 嘉年华 *， 我 们 知道 这 个 会 议 的 主要 组 织 者 之 一 有 你 ， 能 
不 能 谈 谈 目 前 你 对 * 技 术 嘉 年 华 的 一 些 评价 和 你 所 期 望 的 < 技术 嘉 年 
华 * 未 来 可 以 发 展 成 什么 样子 ? 

小 马 : 其 实说 到 咱们 的 嘉年华 会 议 ， 我 要 说 起 一 些 国外 的 会 议 活 
动 ， 比 如 我 们 参加 了 Velocity 大 会 ， 当 时 令 我 印象 很 深刻 的 是 ， 有 一 个 
嘉宾 分 享 了 一 个 观点 :“ 性 能 更 应 该 是 功能 .…..”， 这 让 我 想到 很 多 项 
目 其 实 一 开始 都 很 关注 功能 ， 当 功能 通过 后 ， 先 草草 上 线 ， 而 后 再 逐 
步 完善 性 能 上 的 问题 ， 这 个 嘉宾 的 说 法 让 我 产生 了 强烈 的 共鸣 ， 这 种 
体会 在 这 个 大 会 上 有 很 多 。 因 此 ， 当 参加 完 会 议 后 ， 我 们 都 是 发 自 内 
心地 感到 受益 了 并 佩服 这 种 高 质量 会 议 的 举办 方 ， 当 时 我 们 也 是 想 能 
不 能 把 这 种 会 议 引进 中 国 来 举办 ， 到 现在 我 们 也 是 "Velocity 中 国 " 大 会 
的 组 织 者 。 

说 到 我 们 自己 的 “技术 嘉年华 "， 今 年 是 第 二 届 ， 就 去 年 的 第 一 届 
看 ， 当 时 在 那么 短 的 时 间 和 人 力 紧张 的 情况 下 ， 活 动 的 组 织 方 灵 珊 团 
队 能 够 整合 到 这 么 多 子 品牌 的 力量 ， 而 会 上 的 分 享 内 容 也 丝毫 不 逊色 
于 国内 很 多 门票 非常 昂贵 的 会 议 内 容 ， 第 一 届 的 会 议 质量 得 到 业界 同 
仁 的 认同 ， 这 些 完全 都 是 超出 预期 的 ， 因 此 ， 我 觉得 活动 举办 得 很 成 
功 。 

而 对 于 第 二 届 的 期 望 ， 我 们 当时 也 是 借 公 司 给 的 机 会 去 了 趟 美 
国 ， 国 外 大 会 的 展会 展区 给 我 留 下 了 很 多 印象 ， 比 如 ， 在 国内 很 多 会 
议 的 展台 前 就 发 放 一 些 礼品 、 资 料 ， 有 些 就 是 放 个 盒子 让 参 会 者 放 入 
名 片 等 ， 而 在 国外 会 议 的 展台 前 ， 我 看 到 了 更 多 的 互动 部 分 ， 他 们 会 
在 展位 前 搞 很 多 游戏 式 的 互动 来 收集 参 会 者 的 信息 等 ， 这 种 体验 是 很 
好 的 ， 让 人 觉得 很 舒服 。 所 以 ， 我 当时 体验 了 每 一 个 展台 ( 笑 ) 。 

我 想 我 们 国内 的 大 会 除了 分 享 高 质量 的 内 容 外 ， 是 不 是 也 能 在 大 
会 现场 多 一 些 这 种 轻松 的 互动 元 素 ? 希望 我 们 的 “技术 嘉年华 ”活动 让 
更 多 的 技术 人 员 聚 在 一 起 分 享 到 高 质量 内 容 的 同时 ， 是 不 是 能 够 让 他 
们 感受 到 更 多 技术 带 来 的 快乐 》 本 届 “ 技 术 嘉 年 华 * 也 是 租 下 了 一 层 的 
空间 布展 ， 一 种 新 的 尝试 ， 希 望 届时 的 活动 能 让 大 家 真正 放下 工作 上 


的 压力 ， 得 到 轻松 的 体验 ， 这 样 由 “精彩 的 主题 ?+“ 轻 松 快 乐 的 气氛 ”组 
成 的 会 议 ， 才 是 名 副 其 实 的 “技术 嘉年华 ”。 

对 于 “ADC 技 术 嘉 年 华 ” 的 未 来 ， 我 希望 我 们 能 够 继续 保持 特色 ， 
坚持 最 初 的 想法 ， 在 节约 公司 资源 的 同时 继续 把 握 非 商业 性 会 议 的 方 
向 ， 为 阿里 的 子 公司 和 依赖 于 阿里 生态 圈 生 存 的 企业 技术 人 员 提 供 一 
个 平台 ， 通 过 这 个 平台 可 以 更 加 及 时 全 面 地 了 解 阿 里 ， 我 们 的 会 议 成 
为 业界 风向 标 是 基础 ， 我 们 更 要 向 业界 的 F8 会 议 、Google IO 看 齐 。 

子 柳 : 小 马 是 淘宝 网 第 一 个 做 前 端的 ， 目 前 还 在 做 前 端 ， 现 在 有 5 
年 多 了 ， 给 大 家 简单 介绍 一 下 淘宝 前 端的 发 展 历 程 吧 。 

小 马 : 先 给 大 家 说 一 下 “前 端 * 是 怎么 来 的 ， 我 自己 对 前 端 有 一 些 
思考 。 就 以 淘宝 为 例 ， 一 开始 ， 淘 宝 就 是 一 个 社区 ， 大 家 发 布 信息 给 
别人 看 。 随 着 互联 网 的 发 展 ， 大 家 不 仅仅 要 看 到 一 个 静态 的 页 面 ， 他 
们 更 需要 有 绚丽 的 页 面 ， 有 更 丰富 的 交互 。 也 就 是 说 ， 对 “体验 ”的 要 
求 越 来 越 高 。 这 样 交 互 难 免 变 得 越 来 越 复杂 ， 这 个 时 候 开 发 人 员 并 不 
是 很 适合 做 这 些 事情 ， 而 是 需要 一 个 细 化 的 工种 来 做 这 件 事 情 。 我 个 
人 认为 传统 的 开发 人 员 更 多 的 是 面向 机 器 来 开发 的 ， 更 多 的 是 考虑 
CPU 的 问题 、 内 存 的 问题 、 数 据 库 的 问题 。 实 际 上 需要 一 些 开 发 人 员 
对 “用 户 ” 有 更 敏锐 的 感觉 ， 他 们 来 完成 “界面 * 的 问题 ， 界 面 是 互联 网 
与 用 户 交 互 的 地 方 ， 他 需要 对 体验 有 一 些 认 识 ， 对 “人 ”更 关注 。 从 另 
一 方面 来 看 ， 这 几 年 下 来 ， 客 户 端 越 来 越 多 ， 页 面 要 适应 很 多 客户 
端 ， 这 也 不 是 传统 的 开发 人 员 擅 长 做 的 事情 。 基 于 这 些 原 因 ， 就 产生 
了 这 么 一 个 新 的 工种 。 

进入 淘宝 网 后 ， 一 开始 要 我 做 的 就 是 “怎么 让 淘宝 网 的 页 面 动 起 
来 "”， 让 页 面 展示 更 丰富 的 信息 ， 让 用 户 的 体验 更 加 流畅 。 当 时 还 没有 
前 端 工 程 师 这 个 职位 ， 我 入 职 的 职位 是 "Java 工程 师 ”。 淘 宝 前 端的 工 
作 就 这 样 开 始 做 了 ， 我 们 刚 开 始 做 的 工作 就 是 让 页 面 动 起 来 ， 做 了 很 
多 JavaScript 开 发 工作 ， 让 整个 页 面 变 得 更 加 活泼 ， 这 是 第 一 阶段 淘宝 
前 端的 状况 。 

到 第 二 阶段 ， 随 着 淘宝 的 业务 变 得 越 来 越 复 杂 ， 页 面 也 变 得 越 来 
越 多 ， 前 端 开 发 的 工作 量 就 变 得 越 来 越 大 ， 这 时 就 需要 一 个 很 大 的 团 
队 来 做 这 个 工作 。 与 此 同时 ,，“AJAX” 变 得 流行 起 来 ， 它 改变 了 整个 业 
界 的 开发 模式 ， 很 多 工作 要 通过 前 端 来 实现 ， 这 也 让 前 端的 工作 越 来 


越 多 。 这 个 阶段 前 端的 团队 迅速 成 长 ， 你 可 以 理解 为 ， 第 一 阶段 就 是 
让 页 面 动 起 来 ， 第 二 阶段 是 前 端 和 后 端 合 作 ， 让 页 面 的 体验 更 加 友 
好 。 

再 往 下 一 个 阶段 ， 我 们 发 现 越 来 越 多 的 内 容 在 浏览 器 中 展现 ， 越 
来 越 多 的 浏览 器 出 现 了 (Firefox、Chrome、IE 6 一 正 8) ， 这 让 前 端 
越 来 越 重 ， 就 出 现 了 性 能 的 问题 ， 我 们 又 需要 做 一 些 框架 、 规 范 和 很 
多 优化 的 工作 。 

到 现在 这 两 年 来 看 ， 互 联网 经 过 这 么 多 年 的 发 展 ， 开 发 模式 渐渐 
变 得 比较 稳定 和 成 熟 了 。 传 统 的 开发 人 员 不 擅长 的 事情 现在 有 了 强大 
的 框架 ， 方 便 他 们 很 快 上 手 使 用 。 从 企业 的 成 本 看 ， 原 来 需要 两 个 工 
种 去 做 的 事情 ， 现 在 一 个 工种 就 可 以 完成 。 这 样 慢 慢 出 现 了 一 个 趋 
势 ， 貌 似 不 太 需 要 把 工种 划分 得 这 么 明细 ， 以 后 对 淘宝 来 说 也 会 继续 
存在 前 端 这 个 工种 ， 但 更 多 的 是 做 一 些 架构 和 统筹 方面 的 工作 。 

子 柳 : 现在 很 多 团队 都 在 经 历 着 分 分 合 合 的 变动 ， 从 前 端 团队 来 
看 ， 是 很 典型 的 一 个 例子 ， 你 怎么 看 待 这 些 变动 ? 

小 马 : 刚 开 始 ， 我 们 的 团队 就 四 五 个 人 ， 大 家 在 一 起 按 需 做 页 
面 。 随 着 网 站 业务 的 拆 分 ， 开 始 有 一 些 分 工 ， 例如 ， 有 人 负责 商城 的 
前 端 开发 ， 有 人 负责 主 站 的 前 端 开 发 ， 里 然 业 务 上 有 一 些 分 工 ， 但 团 
队 还 是 一 个 。 表 往 后 面 ， 随 着 淘宝 主 站 的 拆 分 ， 就 出 现 了 “业务 线 ” 的 
概念 ， 例 如 ， 商 品 线 、 店 铺 线 等 ， 这 个 时 候 前 端 团 队 进 行 了 一 次 拆 
分 ， 分 成 几 个 小 团队 进入 每 个 业务 线 。 这 样 拆 分 有 利 有 次， 好 处 是 能 
快速 推动 业务 的 发 展 ， 次 端 是 同一 工种 之 间 缺 少 交 流 ， 会 产生 很 多 重 
复 建设 。 分 久 必 合 ， 过 了 一 段 时 间 ， 团 队 又 合并 到 一 起 了 。 合 久 必 
分 ， 没 多 久 ， 整 个 公司 也 拆 分 了 ， 分 成 几 个 子 公司 ， 我 们 当然 又 得 
拆 ， 团 队 分 别 拆 分 到 几 个 子 公司 。 我 觉得 合 和 分 的 过 程 也 不 用 特别 看 
重 ， 不 同 的 阶段 需要 不 同 的 组 织 形式 。 

到 现在 这 个 阶段 ， 应 该 说 是 半分 半 合 ， 为 什么 说 是 半分 半 合 ? 因 
为 前 端 团队 分 成 了 两 块 ， 一 块 跟 进 业务 方面 的 前 端 开 发 ， 一 块 做 通用 
产品 的 开发 ， 这 样 保 证 了 业务 能 够 得 到 有 效 的 支持 。 另 外 ， 对 于 通用 
的 产品 ， 能 够 有 效 地 管理 起 来 ， 避 免 了 大 家 开发 环境 的 不 一 致 、 标 准 
的 不 统一 等 问题 。 

子 柳 : 畅想 一 下 前 端 未 来 的 发 展 方向 。 


小 马 : 我 认为 ， 未 来 的 方向 是 前 后 端的 界线 越 来 越 模 糊 ， 即 未 来 
要 求 开 发 工程 师 能 够 把 前 后 端的 工作 衔接 起 来 。 我 个 人 比较 认可 一 种 
说 法 : 经 过 这 几 年 开发 模式 的 渐渐 发 展 ， 未 来 前 后 端的 开发 会 融合 起 
来 ， 这 样 的 岗位 叫做 “Web 开 发 工程 师 ”。 

另外 ， 这 个 岗位 叫 什么 名 字 不 重要 ， 重 要 的 是 人 们 对 于 交互 和 体 
验 的 要 求 越 来 越 高 ， 随 着 移动 互联 网 的 应 用 ， 会 产生 更 多 的 交互 方 
式 ， 如 滑动 和 震动 等 。 这 就 要 求 有 人 做 这 方面 的 开发 工作 ， 同 时 还 要 
推动 前 端 技术 的 发 展 。 

子 柳 : 单 从 技术 方向 上 看 ，HTML5 是 不 是 未 来 的 一 个 大 趋势 ? 

小 马 : HTML5 不 是 “HTML4” 的 简单 升级 ， 很 多 人 会 认为 HTML5 
就 是 那些 标签 括号 括 起 来 的 表示 性 的 语言 ， 其 实 HTML5 和 HTML4 不 
是 一 回 事 儿 ， 我 们 现在 所 说 的 HTML5 除 了 有 HTML4 增 加 的 一 些 语义 
性 的 标签 之 外 ， 通 常 ， 我 们 把 CSS3 和 很 多 新 的 JavaScript (简称 JS) 的 
API 都 合 起 来 统称 为 HTIML5。 为 什么 会 有 这 些 变化 ? 我 觉得 原来 的 
HTML4 和 一 些 相 关 的 技术 并 不 能 让 Web 成 为 一 个 很 好 的 开发 平台 ， 它 
只 能 让 Web 作 为 一 个 “界面 ”展现 一 些 内 容 ， 做 一 些 简单 的 交互 。 而 
HTML5 的 目的 是 想 让 整个 web 真 正成 为 一 个 开发 平台 ， 或 者 说 是 让 浏 
览 器 成 为 一 个 适合 开发 大 型 应 用 的 平台 。 你 看 它 的 变化 ， 首 先 HTML5 
标签 的 变化 是 让 它 更 具有 语义 化 ， 然 后 CSS3 把 很 多 展现 型 的 东西 做 了 
加 强 ， 最 重要 的 是 新 增 的 那些 JS 的 API， 你 现在 已 经 可 以 在 浏览 器 本 
地 连接 数据 库 、 使 用 Socket、 使 用 本 地 存储 、 获 取 地 理 位 置 等 ， 很 多 
我 们 以 前 开发 过 程 中 需要 从 后 台 取 得 的 信息 ， 现 在 都 可 以 在 本 地 浏览 
器 中 做 。 这 使 得 浏览 器 变 成 一 个 适合 做 大 型 应 用 的 平台 ， 而 不 是 像 以 
前 一 样 只 做 内 容 的 展示 。 

在 淘宝 的 网 站 上 ，HTML5 已 经 无 处 不 在 ， 淘 宝 是 国内 应 用 
HTML5 最 早 的 网 站 之 一 。 

子 柳 : 在 发 展 的 过 程 中 ， 我 们 从 业界 获取 了 很 多 支持 ， 描 述 一 下 
业界 对 我 们 的 影响 有 哪些 ? 

小 马 : 有 三 家 公司 对 我 们 影响 非常 大 。 

第 一 家 是 Yahoo (雅虎 ) ,，“ 前 端 * 岗 位 的 定义 就 起 源 于 雅虎 。 当 时 
雅虎 的 发 展 如 日 中 天 ， 他 们 有 很 多 优秀 的 技术 和 人 才 ， 并 且 最 早 提出 


前 端的 概念 、 框 架 和 规范 。 我 们 最 早 使 用 的 JS 框架 YUI 就 是 雅虎 创造 
的 ， 我 们 的 很 多 规范 也 是 借鉴 他 们 的 ， 我 们 曾 遇 到 的 性 能 问题 就 参照 
雅虎 提供 的 优化 方案 和 工具 (YSlow) 。 可 以 说 ，2007 年 至 2009 年 ， 
我 们 很 多 东西 都 是 借鉴 雅虎 的 。 

第 二 家 公司 是 Google，Google 为 什么 对 前 端 产 生 这 么 大 的 影响 
呢 ? 是 因为 AJAX 实 际 上 是 被 Google 变 成 一 个 商业 上 很 成 功 的 应 用 ， 它 
的 Gmail、Docs 等 产品 采用 了 大 量 的 AJAX 技 术 ，AJAX 在 Google 的 成 
功 应 用 让 很 多 前 端 和 交互 的 工程 师 开 始 使 用 这 种 技术 ， 让 前 端的 工作 
变 得 更 加 繁荣 。 

第 三 家 就 是 Facebook，Facebook 是 把 体验 和 技术 结合 得 最 完美 的 
公司 。 

其 实 看 起 来 对 我 们 影响 最 大 的 也 就 是 硅谷 历史 上 走 在 最 前 端的 上 
述 三 家 公司 。 

子 柳 : 这 三 家 公司 有 两 家 都 被 * 墙 ”了 〈 即 被 屏 珊 ， 无 法 打开 其 网 
站 ) ， 很 多 人 知道 “ 墙 * 阻 碍 了 信息 的 交流 ， 却 不 知道 “ 墙 * 对 技术 的 发 
展 影 响 很 大 ,，“ 翻 墙 * 是 技术 人 员 必 备 的 技能 。 

小 马 : 确实 是 的 ， 最 搞笑 的 是 有 个 日 本 女优 的 名 字 就 叫 YUI， 有 
段 时 间 搜 索 YUI， 就 会 被 屏 数 掉 。 

子 柳 : 那 回 过 头 来 说 我 们 对 业界 的 影响 有 哪些 呢 ? 

小 马 : 我 们 通过 博客 、 主 办 的 D2 和 翻译 的 一 些 图 书 比较 成 功 地 把 
“前 端 * 岗 位 推 到 了 业界 ， 让 很 多 公司 知道 这 个 工作 的 重要 性 ， 也 让 很 
多 技术 人 员 知 道 自己 从 事 的 是 前 端的 工作 。 

子 柳 : 有 了 孩子 之 后 ， 对 你 有 什么 影响 ? 

小 马 : 影响 很 大 。 其 实 不 是 从 有 了 孩子 开始 ， 从 知道 老婆 怀孕 就 
开始 了 。 以 前 ， 我 的 工作 时 间 相 对 比较 自由 ， 时 间 比 较 充 足 ， 从 老婆 
怀孕 开始 就 要 给 她 做 饭 ， 有 了 孩子 又 要 陪 孩 子 ， 时 间 变 得 非常 碎片 
化 ， 必 须 更 有 效 地 利用 自己 的 时 间 。 另 外 ， 责 任 感 有 了 明显 的 提升 ， 
例如 ， 我 以 前 开车 就 很 少 系 安全 带 ， 有 了 孩子 之 后 就 不 愿意 冒 任何 风 
险 了 ;以 前 感冒 了 就 耗 着 ， 现 在 怕 生 病 传 染 给 孩子 ， 就 开始 关心 和 爱 
惜 自己 的 身体 ; 在 孩子 面前 也 不 敢 说 脏话 了 。 其 实 孩 子 的 成 长 也 督促 
着 我 自己 的 成 长 。 


子 柳 : 你 和 你 的 团队 都 翻译 过 好 几 本 书 了 ， 有 什么 经 验 给 大 家 传 
揪 二 下 ? 

小 马 : 翻译 的 都 是 有 关 前 端 方面 的 书 ， 一 开始 是 因为 觉得 我 们 需 
要 这 方面 的 技术 ， 这 也 可 以 推动 前 端 技术 在 国内 的 发 展 。 写 书 也 不 像 
与 博客 那么 随意 ， 这 是 要 变 成 铅字 的 ， 所 以 要 很 谨慎 ， 这 就 要 求 必须 
把 后 面 的 原理 弄 明 白 ， 对 于 已 经 掌握 的 东西 也 相当 于 复习 了 一 遍 ， 这 
是 一 个 很 好 的 学 习 过 程 。 关 于 团队 一 起 写 书 ， 我 发 现 这 是 一 个 很 好 的 
团队 建设 的 方式 ， 在 写 书 的 过 程 中 ， 大 家 要 有 很 多 交流 ， 能 够 互相 学 
习 ， 互 相 督 促 ， 也 增进 了 彼此 的 感情 。 推 荐 其 他 同事 也 试 试看 。 

另外 一 点 经 验 是 写 书 是 不 赚钱 的 ， 基 本 上 可 以 说 是 公益 性 质 的 ， 
这 要 占用 大 量 的 时 间 。 

子 柳 : 说 说 你 个 人 的 成 长 经 验 ， 给 起 步 阶段 的 同事 一 些 建议 吧 。 

小 马 : 现在 回 过 头 来 看 ， 其 实 成 长 最 快 的 一 段 时 间 是 刚 进 淘宝 的 
那 几 年 ， 那 个 时 候 很 单纯 ， 就 想 着 把 工作 做 好 ， 做 完 一 个 做 下 一 个 ， 
不 管 这 个 业务 是 不 是 重要 ， 需 求 方 是 不 是 好 打交道 。 有 个 “一 万 个 小 时 
理论 "， 我 觉得 很 正确 ， 说 的 就 是 一 个 人 必须 经 过 不 断 地 练习 ， 不 断 地 
遇 到 问题 才能 成 长 起 来 。 当 然 ， 做 的 时 候 要 不 断 总 结 ， 写 博客 是 一 个 
很 好 的 途径 。 

子 柳 : 现在 有 很 多 人 出 去 创业 ， 作 为 一 个 曾经 创 过 业 的 技术 人 
员 ， 你 有 什么 看 法 ? 

小 马 : 很 多 人 创业 是 因为 公司 变 得 越 来 越 大 ， 有 很 多 流程 和 规章 
制度 的 限制 ， 这 样 自己 发 挥 的 空间 越 来 越 小 。 但 是 真 的 到 社会 中 创业 
时 会 发 现 限制 同样 很 多 ， 你 同样 要 面临 税务 局 、 工 商 局 、 丙 标 、 公 司 
注册 、 股 东 关 系 、 员 工 管理 、 同 行 竞争 等 问题 ， 这 跟 你 在 公司 中 工作 
并 没有 本 质 的 不 同 。 所 以 说 创业 其 实 是 一 种 心态 ， 你 用 旺盛 的 精力 、 
饱满 的 热情 和 坚定 的 信念 去 克服 一 个 又 一 个 的 困难 ， 这 就 是 创业 。 到 
外 面 去 创业 和 在 一 个 大 公司 里 创业 ， 我 个 人 觉得 并 没有 本 质 的 区 别 。 

当然 ， 如 果 你 不 认可 公司 整体 的 方向 ， 或 者 你 不 认可 这 个 行业 ， 
你 有 一 个 理想 去 打造 一 个 新 的 天 地 ， 公 司 也 应 该 有 这 种 胸怀 鼓励 你 去 
创业 。 


淘宝 传奇 工程 师 多 隆 的 程序 世界 


多 隆 是 淘宝 的 创始 人 之 一 ， 也 是 淘宝 的 第 一 个 程序 员 ， 他 奠定 了 
诸多 淘宝 重大 软件 项 目的 基础 。 有 人 说 他 是 淘宝 的 “扫地 僧 "， 有 人 说 
他 是 “ 神 *”。 在 淘宝 ， 他 做 到 了 既 懂 C/C++ 语 言 ， 又 懂 Java 和 内 核 ; 既 可 
以 深入 技术 底层 ， 又 能 切入 到 高 层 业务 领域 ， 从 前 端 到 后 端 ， 知 识 婚 
广 又 深 。 他 就 是 核心 系统 部 专家 组 的 多 隆 。 

技术 小 二 中 流传 一 句 话 _ “有 困难 ， 找 多 隆 *。 关 于 这 点 ， 我 深 
有 体会 ， 有 一 次 ， 我 们 组 解决 一 个 Apache 服 务 器 无 故 崩 溃 的 诡异 问 
题 ， 搞 了 三 天 还 没 找 出 原因 ， 于 是 请 教 多 隆 ， 他 在 三 分 钟 后 就 告诉 了 
我 答案 。 瞬 间 的 秒杀 ， 让 我 领教 了 “高 级 研究 员 "的 威力 。 

我 和 多 隆 在 同一 个 部 门 ， 工 位 相 邻 。 这 个 近水楼台 先 得 月 的 条 
件 ， 让 我 平时 有 机 会 观察 他 ， 从 他 的 一 举 一 动 中 思索 他 如 何以 非 科 班 
出 身 (生物 系 生命 科学 专业 ) 成 长 为 计算 机 牛人 。 

多 隆 说 他 知识 经 验 的 积累 主要 归功 于 在 淘宝 业务 发 展 的 过 程 中 ， 
他 遇 到 了 各 种 各 样 的 问题 。 这 些 问题 促使 他 不 断 学 习 解决 问题 的 各 种 
技术 ， 他 和 淘宝 一 起 成 长 。 在 我 看 来 ， 他 对 技术 始终 保持 着 谦 乍 的 心 
态 也 很 关键 。 他 把 自己 当成 海绵 一 样 去 吸收 新 知识 一 一 在 他 的 字典 
里 ， 没 有 不 值得 去 解决 的 问题 ， 也 没有 不 值得 去 学 习 的 技术 。 而 且 每 
学 一 个 知识 点 ， 多 隆 都 会 写 一 段 代码 去 验证 ， 一 方面 是 练习 ， 另 一 方 
面 也 让 他 加 深 理解 ， 直 到 真正 掌握 这 个 技术 。 

多 隆 还 有 一 个 常人 难以 做 到 的 特质 。 当 他 沉浸 在 他 的 程序 世界 
时 ， 外 界 的 人 和 事 很 难 干扰 到 他 。 一 天 的 工作 时 间 里 ， 他 绝 大 部 分 都 
在 座位 上 写 代码 。 若 他 不 在 座位 上 ， 那 基本 上 就 在 洗手 间 。 我 还 记得 
2010 年 公司 的 乒乓 球 比 赛 决赛 是 在 创业 10 楼 的 休闲 吧 举行 的 ， 比 赛 现 
场 距离 多 隆 只 有 20 米 远 ， 锣 鼓 喧 天 ， 人 声 硅 沸 ， 很 多 人 都 被 吸引 过 去 
了 ， 整 个 办 公 区 只 有 多 隆 一 个 人 还 “ 粘 " 在 椅子 上 。 这 大 概 就 是 《功夫 
熊猫 2》 里 的 最 高 武功 心 法 “Inner Peace” (内 心平 静 ) 吧 。 有 了 这 样 的 
专注 力 ， 不 成 为 高 手 也 难 。 

多 隆 从 2000 年 加 入 阿里 巴巴 ， 到 现在 已 经 十 多 年 了 ， 仍 在 淘宝 技 
术 第 一 线 写 代 码 。 我 曾 问 他 是 如 何 坚持 这 么 久 且 至 今 还 这 么 有 激情 。 


他 回答 说 ， 很 简单 ， 因 为 他 在 做 他 喜欢 的 事情 ， 解 决 问题 和 写 代码 让 
他 觉得 很 有 成 就 感 。 有 一 次 ， 我 们 在 从 庐山 郊游 回来 的 火车 上 ， 他 还 
在 写 代码 ， 可 见 他 对 写 代码 喜欢 到 了 什么 程度 。 

在 淘宝 ， 多 隆 被 从 副 总 裁 到 普通 的 软件 工程 师 等 诸多 同事 囊 心 修 
服 ， 广 受 爱戴 。 这 里 面 既 有 大 家 对 多 隆 技术 上 的 认可 ， 更 有 大 家 对 他 
默默 付出 和 人 格 魅 力 的 赞叹 。2011 年 的 公司 年 会 上 ， 那 个 《淘宝 的 一 
年 ， 亲 》 的 视频 曾 感动 了 很 多 小 二 。 很 多 工程 师 为 了 淘宝 线 上 的 稳 
定 ， 奉 献 了 很 多 ， 也 对 亲人 和 家 庭 亏 欠 了 很 多 。 看 视频 的 时 候 ， 坐 在 
我 旁边 的 多 隆 泪 流 满面 。 我 想 ， 他 之 所 以 有 如 此 深 的 感触 ， 是 因为 视 
频 里 的 故事 正 是 他 无 数 个 类 似 不 眠 之 夜 的 写照 “2009 年 之 前 ， 公 司 
甚至 还 没有 视频 里 提 到 的 “消防 群 * 这 个 集体 解决 、 承 担 故 障 的 组 织 ， 
即使 是 半夜 ， 多 隆 都 要 起 来 解决 问题 、 排 除 故 障 。 而 求救 过 他 的 小 二 
说 他 总 是 随 叫 随 到 ， 没 有 架子 ， 态 度 和 薄 ， 任 劳 任 怨 。 直 到 现在 ， 很 
多 消防 群 里 解决 不 了 的 问题 ， 仍 然 会 找 多 隆 来 解决 ， 而 他 也 会 在 第 一 
时 间 出 现 。 

一 个 计算 机 工程 师 该 以 怎样 的 态度 和 方式 来 工作 和 学 习 ? 多 隆 的 
一 条 朴素 的 建议 或 许可 以 很 好 地 解答 :“ 发 现 问 题 ， 解 决 问题 ， 不 要 绕 
开 问 题 的 本 身 ; 多 做 事情 ， 不 会 吃亏 ， 即 使 不 是 你 的 事情 。”* 这 大 概 也 
是 多 隆 最 大 的 成 功 秘诀 吧 。 看 似 容易 的 原则 ， 却 不 是 每 个 人 都 能 做 到 
的 。 做 到 了 ， 你 也 有 希望 成 为 “多 隆 ”。 

始终 保持 对 代码 的 那 份 单纯 的 热爱 ， 保 持 对 技术 的 专注 和 钻研 ; 
别人 把 工作 当 工 作 ， 他 把 工作 当 事 业 这 就 是 多 隆 的 程序 世界 。 

( 注 : 本 文 作者 为 权 度 ) 


